December 11-16 2016 Osaka Japan
W16-46
W16-46
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Chinese or <strong>Japan</strong>ese sentences<br />
Chinese: 在 ♯P 糖 尿 病 ♯NN ,♯PU 更 ♯AD 具 体 ♯VA 地 ♯DEV 1♯CD 型 ♯NN 或 ♯CC 2♯CD 型 ♯NN 糖 尿 病 ♯NN 患 者 ♯NN 的 ♯DEC 情 况 ♯NN 中 ♯LC<br />
,♯PU 本 ♯DT 发 明 ♯NN 的 ♯DEC 药 物 ♯NN 容 许 ♯VV 血 液 ♯NN 葡 萄 糖 ♯NN 浓 度 ♯NN 更 ♯AD 有 效 ♯VA 地 ♯DEV 适 应 ♯VV 于 ♯P 血 糖 ♯NN 正<br />
常 ♯JJ 水 平 ♯NN 。♯PU<br />
<strong>Japan</strong>ese: 本 / 接 頭 辞 発 明 / 名 詞 の/ 助 詞 薬 剤 / 名 詞 は/ 助 詞 、/ 特 殊 糖 尿 / 名 詞 病 / 名 詞 、/ 特 殊 より/ 副 詞 詳 細 に/ 形 容 詞 は/ 助 詞 1/ 特 殊 型 / 接 尾 辞 又<br />
は/ 助 詞 2/ 特 殊 型 / 接 尾 辞 糖 尿 / 名 詞 病 / 名 詞 の/ 助 詞 患 者 / 名 詞 の/ 助 詞 場 合 / 名 詞 に/ 助 詞 血 / 名 詞 中 / 接 尾 辞 グルコース/ 名 詞 濃 度 / 名 詞 を/ 助 詞 正<br />
常 / 形 容 詞 血 糖 / 名 詞 レベル/ 名 詞 まで/ 助 詞 より/ 助 詞 効 果 / 名 詞 的 に/ 接 尾 辞 適 合 / 名 詞 さ/ 動 詞 せる/ 接 尾 辞 こと/ 名 詞 を/ 助 詞 可 能 に/ 形 容 詞<br />
する/ 接 尾 辞 。/ 特 殊<br />
English meaning: ‘In diabetes, more particularly, type 1 or 2 diabetes cases, the drug of the present invention allows<br />
the blood glucose concentration more effectively adapt to normal blood glucose levels.’<br />
Chinese: 在 ♯P 该 ♯DT 方 法 ♯NN 中 ♯LC ,♯PU 能 够 ♯VV 得 到 ♯VV 从 ♯P 心 脏 ♯NN 周 期 ♯NN 内 ♯LC 的 ♯DEG 心 收 缩 ♯NN 期 ♯NN 到 ♯VV 心 ♯NN 舒<br />
张 ♯VV 期 ♯NN 之 间 ♯LC 的 ♯DEG 血 液 ♯NN 移 动 ♯VV 的 ♯DEC 1♯CD 个 ♯M 以 上 ♯LC 的 ♯DEG 图 像 ♯NN 。♯PU<br />
Extracted monolingual terms<br />
型 糖 尿 病<br />
‘the type of diabetes’<br />
葡 萄 糖 浓 度<br />
‘glucose concentration’<br />
血 糖 正 常 水 平<br />
‘normal blood glucose level’<br />
糖 尿 病<br />
‘diabetes’<br />
グルコース 濃 度<br />
‘glucose concentration’<br />
正 常 血 糖 レベル<br />
‘normal blood glucose level’<br />
心 脏 周 期<br />
‘cardiac cycle’<br />
心 收 缩 期<br />
‘systole’<br />
<strong>Japan</strong>ese: この/ 指 示 詞 方 法 / 名 詞 に/ 助 詞 おいて/ 動 詞 は/ 助 詞 、/ 特 殊 心 臓 / 名 詞 周 期 / 名 詞 内 / 接 尾 辞 の/ 助 詞 心 / 名 詞 収 縮 / 名 詞 期 / 名 詞 か<br />
ら/ 助 詞 心 / 名 詞 拡 張 / 名 詞 期 / 名 詞 まで/ 助 詞 の/ 助 詞 間 / 名 詞 の/ 助 詞 血 液 / 名 詞 移 動 / 名 詞 の/ 助 詞 1/ 名 詞 枚 / 接 尾 辞 以 上 / 接 尾 辞 の/ 助 詞 画 像 / 名 詞<br />
が/ 助 詞 得 / 動 詞 られる/ 接 尾 辞 。/ 特 殊<br />
English meaning: ‘In this method, we can obtain more than one images of blood moving from systole of cardiac cycle<br />
to diastole.’<br />
心 臓 周 期<br />
‘cardiac cycle’<br />
心 収 縮 期<br />
‘systole’<br />
心 拡 張 期<br />
‘diastole’<br />
血 液 移 動<br />
‘blood moving’<br />
Table 1: Examples of multi-word term extracted using C-value, based on the linguistic pattern:<br />
(Adjective|Noun) + Noun.<br />
for each ratio are 94%, 92%, 90% and 80%. It is obvious that the precision of the extracted bilingual<br />
multi-word terms decreases rapidly when the ratio tends to 2.5, thus we set the ratio of the lengths in<br />
both directions to a maximum value of 2.0 to keep precision and recall high at the same time. Another<br />
filtering constraint is to filter out alignments of the <strong>Japan</strong>ese part which contains hiragana. This constraint<br />
results from an investigation of the distribution of the components in <strong>Japan</strong>ese by which we found that<br />
multi-word terms made up of “kanji + hiragana” or “kanji + hiragana + katakana” have lower chance to<br />
be aligned with Chinese multi-word terms (see Table 3).<br />
3.2.2 Using Kanji-hanzi Conversion Method<br />
Table 2 leads to the observation that some correctly aligned bilingual terms cannot be extracted by using<br />
the methods we described in Section 3.2.1. Such examples of terms are given in Table 2 with ×. Such<br />
examples are the multi-word terms on one side (Chinese or <strong>Japan</strong>ese) are not multi-word terms in another<br />
side (<strong>Japan</strong>ese or Chinese), or filtered by setting a threshold on translation probabilities. Kanji-hanzi<br />
Extract Correct<br />
Chinese <strong>Japan</strong>ese Meaning P (t|s) P (s|t)<br />
or not or√not<br />
○<br />
葡 萄 糖 浓 度 グルコース 濃 度 ‘glucose concentration’ 0.962121 0.891228<br />
√<br />
○<br />
血 糖 正 常 水 平 正 常 血 糖 レベル ‘normal blood glucose level’ 1.000000 1.000000<br />
√<br />
○<br />
心 脏 周 期 心 臓 周 期 ‘cardiac cycle’ 1.000000 1.000000<br />
√<br />
○<br />
心 收 缩 期 心 収 縮 期 ‘systole’ 1.000000 0.833333<br />
√<br />
○<br />
脂 肪 酸 酯 脂 肪 酸 エステル ‘fatty acid ester’ 1.000000 0.983333<br />
○ ∗ 糖 尿 病 小 鼠 中 肾 小 管 上 皮 细 胞 上 皮 細 胞 - 1.000000 1.000000<br />
○ ∗ 上 述 液 体 状 前 記 アルカリ 活 性 結 合 材 - 1.000000 1.000000<br />
○ ∗ 上 述 靶 蛋 白 種 々の 上 記 - 1.000000 1.000000<br />
√<br />
×<br />
糖 尿 病 糖 尿 病 ‘diabetes’ 1.000000 0.666667<br />
√<br />
×<br />
肺 癌 肺 癌 ‘lung cancer’ 1.000000 1.000000<br />
√<br />
×<br />
杀 生 物 剂 殺 生 物 剤 ‘biocide’ 0.600000 0.107143<br />
√<br />
×<br />
官 能 基 官 能 基 ‘functional group’ 0.250000 0.009231<br />
√<br />
×<br />
废 热 廃 熱 ‘waste heat’ 0.844444 0.240506<br />
Table 2: Extraction of Chinese–<strong>Japan</strong>ese bilingual multi-word terms by setting a threshold P with 0.6<br />
for both directions. ○ and × show the bilingual multi-word term alignment that are kept or excluded. √<br />
and ∗ show the extracted multi-word terms are correct or incorrect alignments by human assessment.<br />
197