トップ > ソリューション > 翻訳前に「改行」や「空白」などの制御文字を事前に取り除く方法とは?

翻訳前に「改行」や「空白」などの制御文字を事前に取り除く方法とは?

現在、産業翻訳の分野ではCAT(Computer Assisted Translation:コンピュータ―支援翻訳)ツールは欠かせない存在になっています。
CATツールは過去に翻訳した同じフレーズを再利用したり、訳抜けをチェックしたり、用語集を即座に検索したりといった翻訳に欠かせない作業がスムーズに行えます。しかし、それができるのも入力となる原文が整っていなければなりません。例えば、もし、原文が途中で改行して2分割されていたら、過去に翻訳した同一文とのマッチングに失敗して、折角の再利用のチャンスを見逃してしまいます。そこで、前処理として、「改行」と「空白」といった制御文字を翻訳前に事前に取り除く必要があります。しかし、これが意外と面倒でかなり時間を取られてしまいます。
弊社には、ボタン一つで、この問題を解決する技術があります。

 このページのPDF版はこちら

課題

あるお客様からマニュアルの翻訳を依頼されました。

全9,000行のマニュアルでしたが、原稿としてテキストファイルが支給されるとあって、CATツールを使えば翻訳は順調に終わると思われました。

ところが、実際にテキストファイルを見ると、あちこちに「改行」や「空白」、「タブ」といった制御文字が使われていて文章が分断されていました。この状態ではCATツールを使用しても文が途切れているので、過去の類似翻訳文の呼出しなどCATツールの機能を生かした翻訳ができません。

なぜ、このようなファイルになってしまったのか。お客様に事情を聞いてみると、私たちに支給されたテキストファイルはWordファイルから作られたもので、そのWordファイルはイラストが多用されていました。そのイラストの位置を調整するために、文章内に「改行」や「タブ」を挿入したとのことでした。

解決策

通常であれば手作業で不要な「改行」や「空白」を取り除かなければなりませんが、ここで弊社が開発した「文章整形ツール」を使用すれば、余分な制御文字を削除する一方で、必要な改行は残し、本来あるべき日本語文章の姿に変換することが出来ます。

このツールは弊社が持つAI技術(自然言語処理技術)の語彙の連接係数を算出する技術を使用しています。この技術は、適用できる文章のカテゴリーに制限は無く、動作も軽いという特徴があります。ユーザーは処理したい文を入力したら、スタートボタンを押すだけです。

まとめ

「文章整形ツール」はボタン一つ押すだけで不要な「改行」、「空白」などを削除して、翻訳しやすい文に整形します。地味なツールですが、その効果は絶大です。弊社ではこのような人的負荷を軽減しつつ、CATツールの性能を最大限引き出す「ちょっとしたツール」を開発し、制作現場に貢献しています。ご興味がある方は、ぜひ一度ご相談ください。

(2019年7月1日)

お電話からお問い合わせ

代表電話
03-3355-4411
営業日 :
カレンダーを表示
受付時間:
9:00~17:30