Steinflussさんの日記 「機械翻訳作業について」

Steinflussさんの日記を全て見る

みんなの新着日記を見る

Steinfluss
Steinfluss日記
2023/10/09 17:48[web全体で公開]
😶 機械翻訳作業について
機械翻訳作業について

小生は、OCR 翻訳アプリで過去散財してきた
亜米利加からの輸入機材を購入したこともあった
ソフトは亜米利加製だったが、
ハードは日本のオムロン製だったとか

欧文文字処理固有で日本語では存在しない
Ligature 書体の変形
Kerning 文字間の変更 詰める
がある、日本語処理ではありえないのだが
活字の画像からのテキスト変換の精度は上がっている

pdfからのテキスト抽出でも
mac windows では改行コードが違うので機種をまたいで作業を行うと
違う作業が入ってくる
macで作業する改行処理が楽になるけど空白が消し飛ぶ場合がある。
Windowsは自動改行処理であっても、すべてにおいて改行が入ってくる
これを前処理で修正する必要がある。
自動処理するツールがあるが、完全ではない

Microsoft Office Lensの処理精度はあがっているので

Microsoft Office Lens -> oneNote -> 翻訳サービス
でそれなりの翻訳はできるが
スラッグ、ネットスラッグ 業界隠語の類は経験と言葉を選ぶのかは
表現の揺らぎ
翻訳サービスの片仮名表記が微妙に違うのが面倒ではある
この校正作業が工数増加の要因かな
いいね! いいね!5

レスポンス

レスポンスはありません。

コメントを書く

コメント欄:(最大1000文字)

※投稿するにはログインが必要です。