いやまあ、学習データにその言語が入ってるかどうかが一番アレではあるんですけど
LLM、それぞれの区間の始まりに対応する終端文字があると結構よくなる気がしてる