05.01.2017 Views

December 11-16 2016 Osaka Japan

W16-46

W16-46

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chinese or <strong>Japan</strong>ese sentences<br />

Chinese: 在 ♯P 糖 尿 病 ♯NN ,♯PU 更 ♯AD 具 体 ♯VA 地 ♯DEV 1♯CD 型 ♯NN 或 ♯CC 2♯CD 型 ♯NN 糖 尿 病 ♯NN 患 者 ♯NN 的 ♯DEC 情 况 ♯NN 中 ♯LC<br />

,♯PU 本 ♯DT 发 明 ♯NN 的 ♯DEC 药 物 ♯NN 容 许 ♯VV 血 液 ♯NN 葡 萄 糖 ♯NN 浓 度 ♯NN 更 ♯AD 有 效 ♯VA 地 ♯DEV 适 应 ♯VV 于 ♯P 血 糖 ♯NN 正<br />

常 ♯JJ 水 平 ♯NN 。♯PU<br />

<strong>Japan</strong>ese: 本 / 接 頭 辞 発 明 / 名 詞 の/ 助 詞 薬 剤 / 名 詞 は/ 助 詞 、/ 特 殊 糖 尿 / 名 詞 病 / 名 詞 、/ 特 殊 より/ 副 詞 詳 細 に/ 形 容 詞 は/ 助 詞 1/ 特 殊 型 / 接 尾 辞 又<br />

は/ 助 詞 2/ 特 殊 型 / 接 尾 辞 糖 尿 / 名 詞 病 / 名 詞 の/ 助 詞 患 者 / 名 詞 の/ 助 詞 場 合 / 名 詞 に/ 助 詞 血 / 名 詞 中 / 接 尾 辞 グルコース/ 名 詞 濃 度 / 名 詞 を/ 助 詞 正<br />

常 / 形 容 詞 血 糖 / 名 詞 レベル/ 名 詞 まで/ 助 詞 より/ 助 詞 効 果 / 名 詞 的 に/ 接 尾 辞 適 合 / 名 詞 さ/ 動 詞 せる/ 接 尾 辞 こと/ 名 詞 を/ 助 詞 可 能 に/ 形 容 詞<br />

する/ 接 尾 辞 。/ 特 殊<br />

English meaning: ‘In diabetes, more particularly, type 1 or 2 diabetes cases, the drug of the present invention allows<br />

the blood glucose concentration more effectively adapt to normal blood glucose levels.’<br />

Chinese: 在 ♯P 该 ♯DT 方 法 ♯NN 中 ♯LC ,♯PU 能 够 ♯VV 得 到 ♯VV 从 ♯P 心 脏 ♯NN 周 期 ♯NN 内 ♯LC 的 ♯DEG 心 收 缩 ♯NN 期 ♯NN 到 ♯VV 心 ♯NN 舒<br />

张 ♯VV 期 ♯NN 之 间 ♯LC 的 ♯DEG 血 液 ♯NN 移 动 ♯VV 的 ♯DEC 1♯CD 个 ♯M 以 上 ♯LC 的 ♯DEG 图 像 ♯NN 。♯PU<br />

Extracted monolingual terms<br />

型 糖 尿 病<br />

‘the type of diabetes’<br />

葡 萄 糖 浓 度<br />

‘glucose concentration’<br />

血 糖 正 常 水 平<br />

‘normal blood glucose level’<br />

糖 尿 病<br />

‘diabetes’<br />

グルコース 濃 度<br />

‘glucose concentration’<br />

正 常 血 糖 レベル<br />

‘normal blood glucose level’<br />

心 脏 周 期<br />

‘cardiac cycle’<br />

心 收 缩 期<br />

‘systole’<br />

<strong>Japan</strong>ese: この/ 指 示 詞 方 法 / 名 詞 に/ 助 詞 おいて/ 動 詞 は/ 助 詞 、/ 特 殊 心 臓 / 名 詞 周 期 / 名 詞 内 / 接 尾 辞 の/ 助 詞 心 / 名 詞 収 縮 / 名 詞 期 / 名 詞 か<br />

ら/ 助 詞 心 / 名 詞 拡 張 / 名 詞 期 / 名 詞 まで/ 助 詞 の/ 助 詞 間 / 名 詞 の/ 助 詞 血 液 / 名 詞 移 動 / 名 詞 の/ 助 詞 1/ 名 詞 枚 / 接 尾 辞 以 上 / 接 尾 辞 の/ 助 詞 画 像 / 名 詞<br />

が/ 助 詞 得 / 動 詞 られる/ 接 尾 辞 。/ 特 殊<br />

English meaning: ‘In this method, we can obtain more than one images of blood moving from systole of cardiac cycle<br />

to diastole.’<br />

心 臓 周 期<br />

‘cardiac cycle’<br />

心 収 縮 期<br />

‘systole’<br />

心 拡 張 期<br />

‘diastole’<br />

血 液 移 動<br />

‘blood moving’<br />

Table 1: Examples of multi-word term extracted using C-value, based on the linguistic pattern:<br />

(Adjective|Noun) + Noun.<br />

for each ratio are 94%, 92%, 90% and 80%. It is obvious that the precision of the extracted bilingual<br />

multi-word terms decreases rapidly when the ratio tends to 2.5, thus we set the ratio of the lengths in<br />

both directions to a maximum value of 2.0 to keep precision and recall high at the same time. Another<br />

filtering constraint is to filter out alignments of the <strong>Japan</strong>ese part which contains hiragana. This constraint<br />

results from an investigation of the distribution of the components in <strong>Japan</strong>ese by which we found that<br />

multi-word terms made up of “kanji + hiragana” or “kanji + hiragana + katakana” have lower chance to<br />

be aligned with Chinese multi-word terms (see Table 3).<br />

3.2.2 Using Kanji-hanzi Conversion Method<br />

Table 2 leads to the observation that some correctly aligned bilingual terms cannot be extracted by using<br />

the methods we described in Section 3.2.1. Such examples of terms are given in Table 2 with ×. Such<br />

examples are the multi-word terms on one side (Chinese or <strong>Japan</strong>ese) are not multi-word terms in another<br />

side (<strong>Japan</strong>ese or Chinese), or filtered by setting a threshold on translation probabilities. Kanji-hanzi<br />

Extract Correct<br />

Chinese <strong>Japan</strong>ese Meaning P (t|s) P (s|t)<br />

or not or√not<br />

○<br />

葡 萄 糖 浓 度 グルコース 濃 度 ‘glucose concentration’ 0.962121 0.891228<br />

√<br />

○<br />

血 糖 正 常 水 平 正 常 血 糖 レベル ‘normal blood glucose level’ 1.000000 1.000000<br />

√<br />

○<br />

心 脏 周 期 心 臓 周 期 ‘cardiac cycle’ 1.000000 1.000000<br />

√<br />

○<br />

心 收 缩 期 心 収 縮 期 ‘systole’ 1.000000 0.833333<br />

√<br />

○<br />

脂 肪 酸 酯 脂 肪 酸 エステル ‘fatty acid ester’ 1.000000 0.983333<br />

○ ∗ 糖 尿 病 小 鼠 中 肾 小 管 上 皮 细 胞 上 皮 細 胞 - 1.000000 1.000000<br />

○ ∗ 上 述 液 体 状 前 記 アルカリ 活 性 結 合 材 - 1.000000 1.000000<br />

○ ∗ 上 述 靶 蛋 白 種 々の 上 記 - 1.000000 1.000000<br />

√<br />

×<br />

糖 尿 病 糖 尿 病 ‘diabetes’ 1.000000 0.666667<br />

√<br />

×<br />

肺 癌 肺 癌 ‘lung cancer’ 1.000000 1.000000<br />

√<br />

×<br />

杀 生 物 剂 殺 生 物 剤 ‘biocide’ 0.600000 0.107143<br />

√<br />

×<br />

官 能 基 官 能 基 ‘functional group’ 0.250000 0.009231<br />

√<br />

×<br />

废 热 廃 熱 ‘waste heat’ 0.844444 0.240506<br />

Table 2: Extraction of Chinese–<strong>Japan</strong>ese bilingual multi-word terms by setting a threshold P with 0.6<br />

for both directions. ○ and × show the bilingual multi-word term alignment that are kept or excluded. √<br />

and ∗ show the extracted multi-word terms are correct or incorrect alignments by human assessment.<br />

197

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!