NISAは「ニーサ」なのか「ナイサ」なのか

[B! togetter] アメリカのVTuberさんが『日本人はカスコー(Costco)のことをコストコって言うんやで発音かわゆす』みたいなお話をなさっていた「tを読まないんか」

このブコメに「NISAも英語読みならniceのようにナイサと呼ぶべき」というものがあり、それは違うんじゃね？と直感的には思ったものの、そんなに説明できる感覚でもないなと思ったので調べてみた。

結論としては「ニーサ」で問題はないだろうと思う。

英単語を構成する文字のうち子音をC、母音をVで表すことにする（一般的な表記のようです）。ここでは「CiCeという形で表される英単語のiにおける発音のルールが、CiCaという形式にも適用されるのか？」という疑問に否定的な回答をしたい。

そのために、

まずCiCaの形（NISA）をとる既知の英単語における "i" の発音がどのようであるか、
その後、CiCeの形（nice）の単語における "i" の発音ルールがどのような成り立ちか

を調べる。

ちなみに英語の発音は綴だけから一意に決めることはできないはずなので、あくまで傾向としてどうか、という話になる（NISAは造語なので傾向がわかればよい）。

CiCa型の単語の "i" の発音を調べる

パッと思いつくものは少ないが、china や diva、visa がここで話題にしたい単語になる。china は /tʃˈaɪnə/ なので「ナイサ」に与する例。diva は /dˈivə/ で「ニーサ」に与する例だ。

NLTK（Natural Language Toolkit）を使って、英単語のリストと CMU Pronunciation Dictionary で網羅的に調べてみる。

from collections import defaultdict
import re

import nltk.corpus
from phonecodes.phonecodes import arpabet2ipa

nltk.download("words", quiet=True)
nltk.download("cmudict", quiet=True)

transcribe = nltk.corpus.cmudict.dict()

# CiCa 型の単語にマッチするだろう正規表現
# CirCa は除いている
re_CiCa = re.compile(
    r"^([bcdfghjklmnpqrstvwxyz]+)i([bcdfghjklmnpqstvwxyz][bcdfghjklmnpqrstvwxyz]*|r)a$",
    re.I,
)

# i に対応する発音で分類
word_pron_by_i = defaultdict(list)

for word in nltk.corpus.words.words():
    if not re_CiCa.search(word):
        continue

    # 母音にはアクセントとして数字が付与されている
    # (C)CVCV になっているもののみを抽出
    prons = transcribe.get(word.lower(), None)
    if not prons:
        continue

    for pron in prons:
        parts = [(p[:-1], "V") if p[-1].isdigit() else (p, "C") for p in pron]
        if [v for (_, v) in parts[-4:]] != ["C", "V", "C", "V"]:
            continue
        word_pron_by_i[parts[-3][0]].append((word, pron))

for i_pron, words in word_pron_by_i.items():
    print(f"===== /{arpabet2ipa(i_pron)}/ ({len(words)}) =====")
    for word, pron in words:
        print(word, "/" + "".join(arpabet2ipa(" ".join(pron)).split(" ")) + "/")

実行するとこうなった。

===== /aɪ/ (6) =====
china /tʃˈaɪnə/
Lima /lˈaɪmə/
mica /mˈaɪkə/
Pica /pˈaɪkə/
pica /pˈaɪkə/
vita /vˈaɪtə/
===== /i/ (30) =====
Chita /tʃˈitə/
diva /dˈivə/
Gila /ɡˈilə/
Lida /lˈidə/
Lila /lˈilə/
Lima /lˈimə/
Lina /lˈinə/
lina /lˈinə/
lipa /lˈipə/
Lisa /lˈisə/
Liza /lˈizə/
Mina /mˈinə/
mina /mˈinə/
Nina /nˈinə/
Pima /pˈimə/
pina /pˈinə/
pita /pˈitə/
prima /pɹˈimə/
rima /ɹˈimə/
ripa /ɹˈipə/
Rita /ɹˈitə/
rita /ɹˈitə/
riva /ɹˈivə/
sima /sˈimə/
spina /spˈinə/
Tina /tˈinə/
vila /vˈilə/
vina /vˈinə/
visa /vˈizə/
viva /vˈivə/
===== /ɪ/ (10) =====
Cyrilla /sɨɹˈɪlə/
Disa /dˈɪsə/
lira /lˈɪɹə/
Mina /mˈɪnə/
mina /mˈɪnə/
Mira /mˈɪɹə/
Scilla /sˈɪlə/
villa /vˈɪlə/
Xylina /zˈaɪlɨnə/
Zilla /zˈɪlə/

/i/ （ニーサ派）が優勢・多数派で、ついで /ɪ/（ニサ？）、/aɪ/（ナイサ）。

あくまで提供されたコーパスに収録された単語と発音のみのリストであってそもそもそんなに数がなく、網羅的でもないものの、こういうコーパスに収録されていない語や発音はそれだけ重要度が低いだろうから問題ないと思う。

CVCeと「マジックe」

ここまでの調査でCiCaにおける "i" の発音はおおかた /i/ でよかろう、という所感を持てた。ではniceにおける "i" の発音はなんなんだ。

CVCe型の単語でVを長く発音する（"i" なら「アイ」、"a" なら「エイ」）のは英語学習者にとっても馴染みの深い現象だと思う。ナイスとかテイクとかね。問題はこれがCVCaにも適用されるものだと考えていいのか？という話。

これについては調べてきました！以上のことは言えることがない。前も紹介した英語の「なぜ?」に答えるはじめての英語史の著者のブログによると、この形のeは「マジックe」と呼ばれていて、歴史的な経緯があってこうなっているらしい（#1289. magic <e> - hellog～英語史ブログ）。これを調べてて知ったけど "e" も発音されていないらしい。たしかに……。

つまるところ、"i" を「アイ」と読むのはマジックeの作用によるもので、eがない場合にも同じように適用できるものではない、と言っていいだろう。

なぜeだけで他の母音についてはおこらなかったのか、という疑問も当然湧くが、後期古英語になると，強勢の落ちない語尾の環境では -a, -o, -u は -e へと融合してゆく（#1344. final -''e'' の歴史 - hellog～英語史ブログ）ともあり、語尾の母音はeに収束していったのかな。

そもそも-aで終わる単語はそんなに英語っぽくない気もしていて、他言語から英語に輸入されてきた経緯もあるのかもしれない。ここは未検証。

まとめ

既知の単語の調査と発音ルールの成り立ちから、NISAの発音はニーサで問題ないのではないか、という感覚の裏付けを取りました。

詩と創作・思索のひろば

ドキドキギュンギュンダイアリーです!!!

NISAは「ニーサ」なのか「ナイサ」なのか

CiCa型の単語の "i" の発音を調べる

CVCeと「マジックe」

まとめ