翻訳かあさん、崖っぷちを走る

(更新お休み中)3歳保育園児と8歳小学生を育てながら働くフリーランス翻訳者のはなし。

予想外にワード数が多かったときの話

お久しぶりです。

月イチの投稿を死守すべく、地下の穴から這い出してまいりました。

 

本日は、ワード数(作業負荷)が想定より多かったときの話。

 

たいした話ではありませんが、どこかで駆け出しの翻訳者さんに役に立つ、かも?

 

私は乳児がいるせいで1日の作業量を英語原文1000ワードくらいまでに抑えていて、取引先にもそのようにお知らせしているので、1万ワードを超えるような大きめの案件の打診はあまり来ません。1000ワードくらいの記事を作業期間2日ほどで請けることが多いです。

 

しかしもう去年のことですが、作業期間が長めに取れるということで、珍しく1万ワードを超える分量を依頼されました。

 

大きいプロジェクトを複数人の翻訳者で分けるというもので、私の担当はファイル数十個のうちの5ファイルでした。

 

説明のため、仮に全ファイル数を20として、私の担当分をFile #16~#20とします。(細かい数値は適当に変えています。)

 

1ファイルごとの分納を指示され、File #20からお願いします、ということだったので、File #20から取りかかりました。WWCは800で、作業を開始したのが木曜の午後、納品が月曜の朝だったので、1日の処理量が少ない私でも余裕で終わるだろうと思って開始しました。

 

ちなみにWWC(Weighted Word Count)というのはCATツールを使ったことがない方には何のことやら、だと思いますが、CATツールを使うと翻訳メモリ(TM)に入っている過去の訳文を使い回しできるので、1から訳すよりは楽になります(よほどうまく管理された翻訳メモリでないと訳文の質には悪影響が出ますが、話が逸れるので割愛)。「TMを使って楽になった分を差し引いて、実際の負荷に近づくように計算しなおしたワード数」がWWCだと思ってください。会社によっては実ワードとか新規換算ワード数とかワークロードとか、いろんな呼び方をするようです。

 

※4月26日追記:つれあいと話していて判明したのですが、WWCを「Whole Word Count=総ワード数」(マッチレートを考慮しない、純粋な全体のワード数)としている会社もあるようです。ご注意ください。コンテキストで判断しましょう。ややこしいなもう。業界で統一してくれ。

 

1万ワードのファイルでも、TMからたくさん流用できるのであれば、WWCは500ワード、ということも十分にあり得ます。

 

さて、File #20は全体のワード数が2500ですがWWCは800だったので、TMからだいぶ流用できるということになります。長めに見積もっても金曜日の夕方には終わるだろうと思って始めました。

 

しかし、木曜の午後に始めて、金曜の昼になってもまだまだ先がありそうです。半分くらいしか進んでいません。何かオカシイな、設定されているTMが間違っているか、お客様がくれたワード数の解析結果が間違っているか、どちらかではないかと思い始めました。

 

そこでワード数の解析結果を改めて見てみると、「Repetitions」(Rep、繰り返し)が2000ワードくらいあることになっていました。本当は開始前にちゃんと見て分析しておくべきなのですが、いつも何も問題なく作業できるお客様だったのと、大きいプロジェクトの一部を担当するというのが年単位でお久しぶりだったので、完全に油断していましたね。

 

 Repとは同じ原文が何度も出てくる場合に使われる分類で、2回目以降は「繰り返し」なので作業負荷が低いとみなされます。初回登場時に訳せば、それ以降は訳す必要がないとみなされ、作業負荷は0%で計算されることもあれば、10%や30%になることもあります(案件によって異なる)。そして、楽になったとされた分、報酬も少なくなります。

 

今回の案件では、この「Rep」の数値に「Cross-File Repetitions」=「ファイル間の繰り返し」も含まれていました。複数のファイルがある場合に、たとえばファイルAで訳した文が、ファイルBやファイルCにも出てくる、というときに使われる分類です(TradosだとRepとCross-File Repは別々に算出されるはずですが、このときはTradosではなく、RepとCross-File Repがまとめて「Rep」になっていた)。

 

解析はFile #16→#17→#18……の順でされて、実はFile #20に出てくる文は#16~19と重複しているものが多く、たまたま私が#20から作業を始めてしまったために#20の実作業負荷が上がってしまったのだろうかと思いました。そうであれば、#20の作業は大変であっても、その後の#16~19の作業は#20で訳し済みのものがたくさん出てくるので楽になるはずです。

 

しかし、#16~19のファイルの中身を改めてよく見てみると、#20と同じ文がそんなにたくさんあるようには見えませんでした。

 

「さてはこれ、他の翻訳者さんの担当ファイルも全部ひっくるめてRepが計算されているな……?」と思い当たりました。

 

つまり、私が担当する#16~20だけで解析されているのではなく、File #1~20全部でワード数(WWC)が算出されているということです。

 

しかしこれは問題です。いくら他人に割り当てられたファイルと重複する文があったとしても、自分の作業はあくまでも「一からの翻訳」になります。リアルタイムで更新されていくオンラインTMを使っていたとしても、自分のところでRepとして計算されている分を、他の翻訳者が先に訳してくれるとは限りません。自分が「最初に訳す人」になることは十分にあり得ます。そうしたら、「Rep」扱いでお金をもらえないのはおかしいですよね。

 

そのときに使っていたクラウド型CATツールは翻訳者が自分でワード数を解析することができませんでした。

 

そこで、CATツールからバイリンガルファイルをエクスポートして、Trados Studioで新規のTMをつくり(TMはエクスポートできなかった)、解析をかけてみました。そうすれば少なくとも自分の担当ファイルだけでのRepがどれくらいあるのかは分かります。

 

File #16~20だけ解析した結果、やはり#20のRepは数百ワードしかありませんでした。

 

f:id:sasa3_neko:20210328103632j:plain

ワード数解析結果の例(数値は適当に入れています)

その時点でもう金曜の夜になっていたので、月曜朝に納品するためにとりあえず週末の夜に頑張りました。体感ではWWCが2000くらいありましたね。

 

何とか終わらせ、納品するときに、お客様に以下の点を問い合わせました。

 

  • Repがとても多いことになっているが、これは私の担当ファイル内だけで算出したものか?(いきなり「間違ってるよね!」と切り出さず、一応確認ね)
  • もし全ファイルで算出しているのであれば、実際の作業負荷と合っていないので、私の担当ファイルだけで解析しなおしてもらえないか?

 

自分が翻訳会社でコーディネーションをしていたときは、たくさんのファイルがあるプロジェクトを複数の翻訳者に分ける場合、翻訳者さんごとにファイルを分けてから、1人ずつ解析をし直して、その数値をもとに発注していました。

 

クライアントからは全ファイルでCross-File Repを算出した分のお金しか支払われないことがほとんどなので(そこは営業が説明して頑張れよ、と思うところではあるが)、翻訳会社としてはつらいのですが、翻訳者さんに実際の作業分のお金をお支払いするのは当たり前のことですからね。

 

今回のお客様は別に翻訳者をだましてやろうと思ったのではなく(いつもとてもいいお客様です)、単に忘れていたか、思いつかなかったのだろうと。

 

問い合わせの内容は、すぐに確認していただけたようで、

  • 解析結果は翻訳者ごとではなく、全ファイルを対象としたものである
  • 解析結果はエンドクライアントから提供されたもので、仕様上、翻訳会社側でも解析しなおすことができない
  • File #20はその他の全ファイルを要約した内容なので、Cross-File Repの影響が大きくなってしまった(実際にその他のファイルではRepがほぼなかった)
  • 出す前に気づかなくてごめんなさい

 

という旨の返信がありました。

ここまでは予想通り、じゃあ報酬はどうなるのか?というと、

 

File #20はすべて新規翻訳扱いとして支払っていただけることになりました。

 

訴えなければ800ワード分のお金しかいただけなかったものが、2500ワード分いただけることになったわけです。Cross-File Repの分だけ何とかなってほしかったのですが、ファジーマッチもひっくるめて全部新規扱いにしてくださったので、誠実な対応をしてくださったな、という印象が残りました。よかったよかった。

 

というわけで、翻訳者が複数人アサインされているプロジェクトでの「Rep」、特に「ファイル間の繰り返し」のワード数は、作業開始前によく確認しないとね……という教訓でした。

 

お客様提供の解析結果が何らかの理由で間違っている(解析をした後にファイルがアップデートされたとか、解析したTMと渡されたTMが違うとか)というのは割りとよくあることなので、疑問に思ったら早めに訊いたほうがいいですね。

 

長くなってしまいました。お読みくださった方、ありがとうございます。