クラウド翻訳サービス「Gengo」のAPIを使って25万文字をわずか10日で翻訳してみた - 準備編

とある仕事でクラウド翻訳サービスのGengoを利用しました。ちょっとしたハマりどころや落とし穴があったのでメモしておきます。

はじめに

この投稿はGengo APIの使い方に重点を置いてます。Gengoを使う上での注意点(ハマりどころ)は別にまとめますので、そちらもあわせてお読みください。

今回の対象案件のイメージ

今回の案件はこんな感じ。

  • 文字数1000程度の英語文章が250件程度
  • ひとつひとつの文章はそれぞれ独立したトピック
  • 英語から日本語への翻訳
  • 手持ちの時間は10営業日

1000文字×250件なので文字数約25万文字。これを一人の翻訳者に頼むと一ヶ月くらいかかる見込みですが、 今回はGengoを使うことで期間を短くします。

クラウド翻訳のサービス特徴

さて、国内でクラウド翻訳サービスと言えばGengoConyacです。一般的なクラウドソーシングまで含めるとクラウドワークスランサーズも考えられますね。 GengoやConyacに共通した特徴として

  • 翻訳者は運営側の審査をパスしており、質が一定担保されている
  • APIがありプログラマブルに発注できる
  • 翻訳状況や翻訳結果のAPI経由で取得でき管理しやすい
  • テスト環境(SANDBOX)があり開発しやすい

という点があります。 Gengoの場合はこれに加えてプログラミング言語ごとにAPIのラッパーライブラリがあります。

翻訳のお値段的はConyacが1文字1.5円のようです。 一方、Gengoは基本料金が7円でAPI経由だと1円安くなって6円です。 今回は品質にお金をかける意味でGengo使います。

Gengo API経由の利用料金
Conyacの利用料金

開発環境

開発は以下の環境で行いました。

  • OS : Ubuntu14
  • 言語 : python2.7
  • DB : なし

Python3でも試しましたが、GengoAPIのライブラリのインストールでこけたので諦めました。 Python以外にもPHPやRubyなどのライブラリもあるので好みの言語を使っていいと思います。

開発資料はだいたい以下にまとまっています。

SANDBOXはたまにリダイレクトループがおきます。もしそうなったらしばらく置いてからアクセスしてみてください。

SANDBOXアカウント作成

さて、では開発を進めていきましょう。まずはSANDBOXにアカウント登録します(SANDBOXのアカウントはGengo自体のサービスアカウントとは別モノです)。

SANDBOX用アカウント作成

APIキーの取得

次にAPIキーの取得です。APIキーはGengoのサービスアカウント(≠SANDBOXアカウント)を作って入手します。以下のリンク先からGengoのサービスアカウントを発行してください。 ちなみに、GengoはGoogle+やFacebookのアカウントで使えますが、個人的には素直にアカウントを作成したほうが良い気がします。翻訳結果を複数人でチェックするために管理画面を共有するとなると、自分のGoogleやFacebookアカウントを教えなければならなくなりますからね。

Gengoサインアップ

サインアップが済んだらログインして、画面右上のアカウント名のところから「設定->API環境設定」と進んでください。

APIキー

秘密鍵のボタンを押すと、鍵となる文字列が表示されます。公開鍵とともにテキストに控えておいてください。

クライアントライブラリインストール

次にクライアントライブラリをインストールします。ここではpipでインストールする場合とソースコードからインストールする方法を紹介します。まずはpipでのインストール。

# pipのインストール
wget https://bootstrap.pypa.io/ez_setup.py -O - | sudo python

# Gengoライブラリのインストール
sudo pip install gengo

ちなみにpython3でインストールしようとするとこんな感じでこけました。

sudo pip install gengo

>>> from gengo import Gengo
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Usr\python33\lib\site-packages\gengo\__init__.py", line 34, in <module>
    from gengo import Gengo, GengoError, GengoAuthError
ImportError: cannot import name Gengo

続いてはソースコードからダウンロードする方法。

# gitのインストール
sudo apt-get install git

# ソースコードをクローン
git clone git://github.com/gengo/gengo-python.git

# setuptoolが必要になるのでインストール
wget https://bootstrap.pypa.io/ez_setup.py -O - | sudo python
cd gengo-python
sudo python setup.py install

準備編はここまでです。
次は実装編です。