印度本地化
对于 UTF-8 语言环境支持的所有印度语言,可以使用基于拼音查找的输入法 () 和连续拼音输入法。 使用这些输入方法和虚拟键盘,可以在所有 CDE 应用程序中输入印度语文本。
以下数据流说明了印度语输入过程的工作原理。
如何使用印度输入法
单击输入状态区域,显示输入法选择菜单。
从菜单中选择输入法。
或者,您可以按 F6 从可用的输入法中进行选择。
您还可以键入 -hi 键序列来选择以前的输入法。
按 F5 键选择要使用的印度文。
对于基于键盘(印度语键盘)的输入法,请使用印度语键盘中显示的键盘图像。
对于基于拼音查找的输入法,请键入与目标脚本中的字符相对应的第一个拼音等效字符。
从“查找”窗口中显示的选项列表中进行选择。
对于连续拼音输入法,请连续输入对应的英文拼音字符。
目标脚本中的相应字符将显示在预编辑区域中,并且在后续输入后预编辑文本明确时或显式提交时将被提交。 有关连续拼音输入法中的英文标记与目标脚本的 UTF-8 代码点之间的映射的说明,请参阅基于连续拼音的输入法的映射中给出的图表。
按 Ctrl-空格键切换回英语/欧洲输入模式。
另外,单击状态栏中的 ,从输入模式选择窗口中选择英语/欧洲输入模式。
印地语键盘
下图显示了印度语输入法的可用键盘布局。
下图显示了孟加拉语键盘的布局。
下图显示了梵文键盘的布局。
下图显示了古吉拉特语键盘的布局。
下图显示了果尔穆基语键盘的布局。
下图显示了卡纳达语键盘的布局。
下图显示了马拉雅拉姆语键盘的布局。
下图显示了泰米尔语键盘的布局。
下图显示了泰卢固语键盘的布局。
了解映射
基于连续拼音输入法的映射中的图像显示了每个支持的目标脚本中英文标记与其等效代码点之间的映射。 类别表示英语标记和脚本的辅音之间的映射。 VOWEL 类别表示英语标记和脚本元音之间的映射。 OTHER 类别包含不具有辅音和元音特征的字符的映射(其格式不随两侧的字符而改变)。
关键字 VOWEL 和 OTHER 也表明这些字符是标准的一部分。 、VOWEL 或 OTHER 表示:虽然这些字符原则上显示了辅音、元音或其他字符的特征,但它们并未正式包含在标准中,并且与字体无关。 它们是分配在私有用户空间中的代码点值。 它们在 UTF-8 语言环境中受支持,但映射可能无法在不同平台上工作。
这些映射文件与系统中的映射文件不同,但已被编辑以删除对本文讨论不重要的关键字。
在 和 段落中,根据上下文,同一英文标签会显示独立格式和相关格式。 请参阅连续拼音输入法的工作原理。
该脚本包含特殊的 '' 部分,它实际上是 OTHER 类别。
基于连续拼音的输入法映射
下图显示了从英语到目标印度语脚本中等效拼音字符的现有映射。 使用这些图作为参考,直到您了解所使用的脚本的所有映射。 这里给出的映射非常直观,因此您应该能够在不看图表的情况下输入大多数字符。
注意-
特殊字符,例如“.” 和“|” 作为使用“\”字符转义的映射的一部分包含在这些映射中。 在不转义的情况下,如果多个标记表示相同的 UTF-8 字符,则“|” 字符将用作分隔符。
、 和 显示辅音、元音和其他字符的英语到孟加拉语的映射。
图 4–1 孟加拉语辅音字母映射
图 4–2 孟加拉语元音映射
图 4–3 其他孟加拉语字符映射
,并显示辅音、元音和其他字符的英语到古吉拉特语的映射。
图 4–4 古吉拉特语辅音字母映射
图 4–5 古吉拉特语元音映射
图 4–6 其他古吉拉特语字符映射
、 和 显示辅音、元音和其他字符的英语到古尔穆基语的映射。
图 4–7 辅音字母映射
图 4–8 古尔穆基语元音映射
图 4–9 其他 字符映射
辅音、元音和其他字符的英语到印度语映射,如 、 和 中所示。
图 4–10 印度辅音字母映射
图 4–11 印度语元音映射
图 4–12 附加印度字符映射
辅音、元音和其他字符的英语到卡纳达语的映射在 、 和 中给出。
图 4–13 卡纳达语辅音映射
图 4–14 卡纳达语元音映射
图 4–15 其他卡纳达语字符映射
,并给出辅音、元音和其他字符的英语到马拉雅拉姆语的映射。
图 4–16 马拉雅拉姆语辅音映射
图 4–17 马拉雅拉姆语元音映射
图 4–18 附加马拉雅拉姆语字符映射
并给出辅音和元音的英语到泰米尔语映射。
图 4–19 泰米尔语辅音映射
图 4–20 泰米尔语元音映射
,并给出从英语到辅音、元音和其他字符的映射。
图 4–21 辅音映射
图 4–22 元音映射
图 4–23 其他字符映射
连续拼音输入法的工作原理
对于每个印度文字,“”或等效标记与辅音组合成为辅音的半形式(或可组合形式)。 只要输入辅音对应的多键组合,就会输出辅音+的形式,表示可以开始字符的组合。
首先输入的辅音采用其另一半形式,随后以完整音节或其变体形式输入元音。
两个连续的辅音仍然是可组合的半形式。 布局引擎可以将半形式转换为单个组合字符,或保留在语法上对所有语言都有效的单独形式。
单词的任何首元音或任何后跟另一个元音的元音都是独立形式。 元音后跟辅音是相关格式。
在任何上下文中都不会改变形状的字符称为其他字符。 这些字符既不是辅音也不是元音。
不构成字符的数字和其他标点符号会一对一映射。
使用上述原则,编写解析器将输入解析为不同的类别并输出特定于语言的代码点。 连续拼音输入法引擎不处理布局或呈现,相关处理由系统中的其他模块完成。