December 11-16 2016 Osaka Japan
W16-46
W16-46
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
of functional words and errors of part of speech (POS) and word order which seem due to errors in preordering.<br />
This suggests that improvement of pre-ordering might be more effective to better translation<br />
quality than increasing parallel corpora for EJ and CJ translation, which seems compatible with a future<br />
work derived from an analysis of crowdsourcing evaluation, which shows a poor correlation between<br />
automatic and human evaluations in JPC-EJ, and JPO adequacy evaluation.<br />
Error Type EJ CJ KJ<br />
Insertion 0 0 6<br />
Deletion 4 9 1<br />
OOV 6 9 2<br />
Mistranslation(content word) 44 41 30<br />
Mistranslation(functional word) 21 51 0<br />
Pre-ordering 33 45 0<br />
Other 6 7 2<br />
Total <strong>11</strong>4 <strong>16</strong>2 41<br />
Table 2: Errors of patent subtask<br />
5.2 Error Analysis of Scientific Paper Subtask<br />
We analysed errors of translations in EJ and CJ scientific paper subtask from a viewpoint of domain<br />
adaptation. As described in section 3, what we used to train SMTs for this subtask are not ASPEC<br />
corpora but our patent corpora. Therefore, some of the mistranslations must be recognized as domainspecific<br />
errors. That is, words and expressions which appear frequently in scientific papers but seldom<br />
in patent documents must have tendencies to be mistranslated. Similarly, what appear frequently in<br />
patents but seldom in papers and what appear frequently in both domains but are often translated differently<br />
might also be mistranslated. We call these types of error as “type A” and “type B” error respectively.<br />
Table 3 shows their examples. In example 1, word “paper(academic article)” is mistranslated<br />
as “ 紙 (physical paper),” which can be categorized as a type A error. Word “discusses” is mistranslated<br />
as “ 開 示 されている(disclose),” which can be categorized as a type B error. Example 2 shows another<br />
type B error, where word “ 我 们 (we)” is mistranslated as “ 本 発 明 者 ら(the inventors).”<br />
Example 1<br />
Source<br />
Reference<br />
MT<br />
This paper discusses the mechanism of the heat return reaction.<br />
熱 戻 り 反 応 の 機 構 を 議 論 した<br />
この 紙 は, 熱 戻 り 反 応 の 機 構 が 開 示 されている。<br />
Example 2<br />
Source<br />
Reference<br />
MT<br />
由 此 , 伴 随 中 国 乡 镇 向 城 市 化 发 展 而 增 加 的 环 境 负 荷 , 我 们 从 大 气 污 染 角 度<br />
着 手 并 利 用 环 境 库 兹 涅 茨 曲 线 进 行 环 境 分 析 , 再 将 与 他 发 达 国 家 的 城 市 环<br />
境 相 比 较 , 探 讨 了 降 低 环 境 负 荷 的 可 能 性 。<br />
このような 状 況 から, 中 国 の 都 市 化 に 伴 う 環 境 負 荷 の 増 大 について 大 気 汚 染 に<br />
着 目 して 環 境 クズネック 曲 線 を 用 いて 分 析 し, 先 進 諸 国 の 都 市 の 動 向 と 比 較 し<br />
て,その 環 境 負 荷 低 減 策 の 可 能 性 について 考 察 した。<br />
これにより, 中 国 タウン 都 市 化 発 展 に 増 加 した 環 境 負 荷 を 伴 って, 本 発 明 者 ら<br />
は, 大 気 汚 染 の 観 点 から 着 手 し, 利 用 環 境 库 兹 涅 茨 曲 線 環 境 分 析 を 行 い,さ<br />
らに, 彼 と 先 進 国 の 都 市 環 境 と 比 較 して, 環 境 負 荷 を 低 減 する 可 能 性 を 検 討 し<br />
た。<br />
136