タグ: 翻訳セキュリティ

  • AI翻訳の学習データ問題|入力した文書が漏洩する仕組みと対策

    AI翻訳の学習データ問題|入力した文書が漏洩する仕組みと対策

    AI翻訳の学習データ問題|入力した文書が漏洩する仕組みと対策

    2023年、Samsungのエンジニアが社内の機密ソースコードをAIチャットボットに入力したことで情報漏洩が報告されました(Forbes, 2023)。同様のリスクはAI翻訳ツールにも潜んでいます。結論から言えば、学習利用の有無はサービスごと・プランごとに異なり、規約の確認が必要です

    本記事では、AI翻訳の学習データ問題の仕組みと、具体的な対策を解説します。

    AI学習に使われる仕組み

    AI翻訳ツールが入力データを学習に利用する仕組みについて、技術的な観点から解説します。学習利用の有無はサービスごと・プランごとに異なるため、規約の確認が必要です。

    モデルの再学習(ファインチューニング)

    AI翻訳サービスの中には、ユーザーの翻訳履歴を収集し、モデルの再学習(ファインチューニング)に利用するものがあります。学習利用の有無はサービスごと・プランごとに異なるため、規約の確認が必要です。再学習に利用される場合、入力されたテキストの情報がモデルのパラメータに組み込まれることになります。

    具体的な流れ:

    1. ユーザーが「当社の2026年第3四半期売上高は150億円でした」を入力
    2. AIが翻訳結果を生成
    3. 入力と出力のペアが学習データに追加
    4. モデルの再学習で、このデータがパラメータに反映

    モデル記憶(Memorization)の問題

    AIモデルは、学習データを「丸暗記」する性質があることが研究で指摘されています。これは「モデル記憶(memorization)」と呼ばれる現象で、大規模言語モデル(LLM)を対象とした複数の研究で確認されています(Carlini et al., 2023)。

    モデル記憶が起きると、他のユーザーが似たような質問や入力をした際に、学習に使われた機密情報がそのまま出力される可能性があります。例えば、「〇〇社の売上高を教えて」という入力に対して、学習データに含まれていた財務数値がそのまま出力されるケースです。

    データの第三者提供

    利用規約で「サービス改善のためにデータを利用する」とある場合、これは内部的な学習に限らず、提携先へのデータ提供を含む可能性があります。また、サーバー侵害や法的要請(捜査令状など)により、保存されているデータが第三者に開示される経路もあります。

    影響を受ける文書の例

    AI学習データ問題の影響を特に受けやすい文書の例を挙げます。

    法務文書

    • 契約書:取引条件、価格、秘密保持条項
    • NDA(秘密保持契約):守るべき秘密情報そのものを入力することに
    • 訴訟資料:係争中の事実関係、証拠、戦略

    財務文書

    • 決算書・財務諸表:未公表の業績データ
    • 監査報告書:内部統制の指摘事項
    • 税務資料:申告内容、税務調査の対応方針

    技術文書

    • 特許出願書類:出願前の発明内容(新規性喪失のリスク)
    • 研究レポート:未発表の研究成果
    • システム仕様書:インフラ構成、セキュリティ設定

    人事文書

    • 雇用契約書:給与条件、競業避止義務
    • 人事評価:個人評価、昇格・降格の検討内容
    • 懲戒処分通知:処分理由、事実関係

    対策3選

    AI翻訳の学習データ問題に対する具体的な対策を3つ紹介します。

    対策1:学習非利用モードのあるツールを使う

    実務上の有力な対策は、AI学習にデータを利用しない方針が明記された翻訳ツールを使うことです。じたん翻訳のシークレットモードは、翻訳データがAIの学習に使われない設定で翻訳処理を行います。

    選び方のポイント:

    • 利用規約で「学習に利用しない」が明記されている
    • シークレットモードなど、ワンクリックで設定できる
    • 処理完了後のデータ自動削除がある

    対策2:機密部分をマスキングしてから翻訳する

    ツールの変更が難しい場合は、翻訳前に機密情報をマスキング(伏せ字化)します。具体的には、社名、人名、金額、固有のプロジェクト名などを「〇〇社」「XXX万円」などに置換してから翻訳し、翻訳後に元に戻します。

    ただし、この方法は手間がかかり、マスキング漏れのリスクがあります。定型的な文書以外には不向きです。

    対策3:ローカル環境で翻訳する

    インターネットに接続しないローカル翻訳環境を構築すれば、データが外部サービスへ送信されるリスクを大きく抑えられます。ただし、翻訳精度や対応言語に制約がある場合があり、導入・保守コストも高くなります。

    実用的なバランスを取るなら、対策1の学習非利用モードのあるクラウド翻訳ツールが最もおすすめです。

    漏洩リスクを下げる実務フロー

    AI翻訳を完全に禁止すると、現場では結局、個人判断で別のツールを使ってしまうことがあります。重要なのは、使ってよい場面と使ってはいけない場面を分けることです。

    ステップ1:文書を3段階に分類する

    まず、翻訳したい文書を次の3段階に分けます。

    区分 推奨対応
    低リスク 公開済みの製品説明、Webページ、一般的な案内文 通常の翻訳ツールでも可
    中リスク 社内マニュアル、顧客名を含まない提案書、業務メール 学習非利用モードを推奨
    高リスク 契約書、個人情報、未発表資料、技術仕様書 シークレットモード必須、必要に応じて承認制

    この分類を先に決めておくと、「急いでいるから無料ツールに貼り付ける」という判断を防ぎやすくなります。

    ステップ2:翻訳前に削れる情報を削る

    翻訳の目的が内容理解だけであれば、会社名、個人名、金額、契約番号などを削っても支障がない場合があります。特に契約書や提案書では、本文の意味を把握するために不要な固有情報を事前に伏せるだけでもリスクを下げられます。

    ステップ3:翻訳後のファイルを放置しない

    翻訳後のファイルは、原文と同じ機密度で扱う必要があります。ダウンロードフォルダ、チャット添付、個人クラウドに残った翻訳済みファイルから漏洩するケースも考えられます。翻訳後は必要な保存場所へ移し、中間ファイルは削除する運用にしましょう。

    ステップ4:法務・情報システム部門と例外ルールを決める

    すべての文書を現場判断にすると、ルールが曖昧になります。契約書、個人情報、顧客データ、未公開技術情報などは、利用できる翻訳ツールや承認フローを明文化しておくべきです。例外ルールがあると、急ぎの案件でも安全な判断がしやすくなります。

    まとめ

    AI翻訳ツールに入力したテキストは、モデルの再学習に利用される可能性があります。モデル記憶の現象により、機密情報が間接的に漏洩するリスクもあるため、法務・財務・技術・人事の各分野の機密文書には注意が必要です。

    対策として現実的なのは、シークレットモードなど、AI学習への非利用方針を明示した翻訳ツールを使うことです。じたん翻訳なら、シークレットモードを有効にすることで、翻訳データがAIの学習に使われない設定で処理できます。

    じたん翻訳のシークレットモードを無料で試す

    FAQ

    Q1. モデル記憶によって、どの程度の情報が漏洩する可能性がありますか?

    モデル記憶は、学習データに頻出する特定のフレーズに対して発生しやすいことが分かっています。一度だけ入力した短いテキストがそのまま出力される確率は低いですが、ゼロではありません。機密情報はそもそも入力しないことが最善の対策です。

    Q2. 翻訳後にデータを削除してもらえば安全ですか?

    手動削除は確実性に欠けます。削除の依頼を忘れたり、バックアップから漏れたりするリスクがあります。自動削除の仕組みがあるツールを選ぶことを推奨します。じたん翻訳は翻訳完了後にファイルを自動削除します。

    Q3. 社内規定で「無料翻訳ツールの使用禁止」となっている場合は?

    社内規定に従うことが大前提です。ただし、規定の意図は「AI学習へのデータ利用を防ぐ」ことにある場合が多いため、学習非利用を明記したツールであれば、社内で再度検討の余地があるかもしれません。じたん翻訳のシークレットモードは、セキュリティ要件を満たすツールとして提案できます。


    関連記事

  • 翻訳ツールはAI学習に使われる?機密文書を安全に翻訳する選び方

    翻訳ツールはAI学習に使われる?機密文書を安全に翻訳する選び方

    翻訳ツールはAI学習に使われる?機密文書を安全に翻訳する選び方

    「翻訳ツールに機密文書を入力しても大丈夫?」——この疑問を持ったことがあるビジネスパーソンは少なくありません。結論から言えば、学習利用の有無は、サービスごと・プランごとに異なるため、規約の確認が必要です。契約書、財務諸表、社内規程といった機密性の高い文書を翻訳する際は、ツールの選び方が極めて重要です。

    本記事では、翻訳ツールがAI学習にデータを利用する仕組みと、機密文書を安全に翻訳するための具体的な選び方を解説します。

    無料翻訳ツールがAI学習に使っている仕組み

    翻訳ツールの中には、ユーザーが入力したテキストをAIモデルの改善に活用するものがあります。学習利用の有無はサービスごと・プランごとに異なるため、規約の確認が必要です。サービス向上を目的とする場合でも、機密情報が意図せず学習データに含まれるリスクがあります。

    なぜ学習データに使われるのか

    AI翻訳の精度を向上させるには、大量の翻訳データが必要です。無料サービスの場合、ユーザーが入力したテキストとその翻訳結果が、モデルの再学習や評価に使われることがあります。具体的には以下のような流れです。

    1. ユーザーがテキストを入力
    2. AIが翻訳結果を生成
    3. 入力テキストと翻訳結果がサーバーに保存
    4. 保存されたデータがモデルの改善に活用される

    この過程で、契約条項、顧客名、財務数値などの機密情報が学習データに混入する可能性があります。一度学習に使われると、その情報を完全に削除することは極めて困難です。

    IPA「情報セキュリティ10大脅威2026」でも指摘

    独立行政法人情報処理推進機構(IPA)が発表した「情報セキュリティ10大脅威2026」では、AIサービスへの機密情報入力がリスクとしてランクインしました。国レベルで警鐘が鳴らされている問題でもあります。

    各社の利用規約比較

    主要な翻訳ツールの利用規約を比較しました。

    サービス AI学習への利用 ファイルサイズ上限 機密文書の適性
    Google翻訳 利用する可能性あり 10MB 不適切
    DeepL無料版 利用する可能性あり 5MB 不適切
    DeepL Pro プランにより異なる 15〜32MB(プランによる) 条件付きで適切
    じたん翻訳(シークレットモード) 利用しない 20MB 適切

    Google翻訳では、無料版で10MBまでのファイル翻訳が可能です(.docx/.pdf/.pptx/.xlsx対応)。DeepL無料版は5MBまでで、入力データの扱いは規約確認が必要です。DeepL Pro(Starter/Advanced/Ultimate)では、データが同意なくAI学習に利用されない旨が案内されています。一方で、じたん翻訳のシークレットモードは、翻訳データがAIの学習に使われない設定で処理します。

    機密文書を安全に翻訳する5つの基準

    機密文書の翻訳に使えるツールを選ぶ際は、以下の5つの基準を確認してください。

    1. AI学習データへの非利用を明記しているか

    利用規約で「入力データをAIの学習に利用しない」ことが明記されているかを確認します。「利用する場合がある」という曖昧な表現は、機密文書には不適切です。

    2. データの暗号化を行っているか

    通信の暗号化(HTTPS)は当然として、保存データの暗号化も重要です。AWS S3のサーバー側暗号化など、業界標準の暗号化が実装されているかを確認しましょう。

    3. ファイルの自動削除があるか

    翻訳完了後、ファイルがサーバーに残り続けるのはリスクです。翻訳後のファイルを一定期間で自動削除する仕組みがあるツールを選びましょう。じたん翻訳では、翻訳完了後に入力ファイルを自動削除します。

    4. ウイルススキャンを実施しているか

    アップロードされたファイルに対してウイルススキャンを実施しているかも重要な基準です。ClamAVなどのマルウェアスキャンを自動で行うツールは、セキュリティ意識が高い証拠です。

    5. ユーザー単位のデータ分離があるか

    他のユーザーが自分のファイルにアクセスできない仕組みが必須です。ユーザーIDごとにデータを分離し、署名付きURL(Presigned URL)でのみダウンロードできる仕組みが理想的です。

    シークレットモードとは

    じたん翻訳の最大の差別化ポイントが「シークレットモード」です。

    シークレットモードを有効にして翻訳すると、以下の方針で処理されます。

    • 翻訳データをAI学習に利用しない設定で処理する
    • 翻訳処理のみに使用し、処理完了後にデータを破棄

    契約書、特許文書、財務諸表、M&A関連資料など、情報漏洩が許されない文書の翻訳に最適です。100チケットの無料枠でもシークレットモードを利用できるため、まずは小さな文書で試すことをおすすめめします。

    シークレットモードが特に重要な文書

    – 法務関連:契約書、NDA、合意書、訴訟資料

    – 財務関連:決算書、監査報告書、税務資料

    – 人事関連:雇用契約書、給与規程、評価シート

    – 技術関連:特許出願書類、研究レポート、仕様書

    社内でAI翻訳を使う前に決めるべきルール

    機密文書の翻訳は、個人の注意だけに任せると運用がばらつきます。社内でAI翻訳を使うなら、最低限以下のルールを決めておくと安全です。

    1. 翻訳してよい文書と禁止文書を分ける

    公開済み資料、一般的な案内文、社外向けWebページなどは比較的リスクが低い一方で、契約書、個人情報、未発表の決算情報、技術仕様書は慎重に扱うべきです。文書の種類ごとに「通常モード可」「シークレットモード必須」「翻訳禁止または承認制」を決めておくと、現場が迷いにくくなります。

    2. 無料ツールの利用条件を明文化する

    「無料翻訳ツールは禁止」とだけ書くと、現場では何が禁止なのか分かりにくくなります。重要なのは、無料か有料かではなく、入力データがどのように扱われるかです。規約上の学習利用、保存期間、第三者提供、削除方針を確認し、使ってよいサービスを一覧化しましょう。

    3. 個人情報と社外秘情報は事前にマスキングする

    どうしても一般的な翻訳ツールを使う場合は、氏名、住所、メールアドレス、金額、会社名、プロジェクト名などを伏せ字にしてから翻訳します。ただし、マスキングは漏れが起きやすいため、機密性が高い文書ではシークレットモードや承認済みツールを使う方が現実的です。

    4. 翻訳後ファイルの保管場所を決める

    翻訳後のファイルも機密情報です。ローカルのダウンロードフォルダに置いたままにする、個人のクラウドストレージに保存する、といった運用は避けるべきです。社内で定めた共有フォルダや文書管理システムに保存し、不要になった中間ファイルは削除するルールを作りましょう。

    判断に迷う文書の例

    文書 推奨対応
    公開済みの会社案内 通常モードでも可
    社内マニュアル 内容に個人情報や内部手順があればシークレットモード
    契約書・NDA シークレットモード必須、必要に応じて法務確認
    未発表の決算資料 承認制またはシークレットモード必須
    顧客名入り提案書 顧客名を含むためシークレットモード推奨
    特許出願前の技術資料 外部流出リスクが高いため慎重に扱う

    このように、文書の種類ごとに扱いを決めておくと、翻訳ツールの選定が単なる好みではなく、業務ルールとして運用できます。

    まとめ

    学習利用の有無は、サービスごと・プランごとに異なります。機密文書を安全に翻訳するには、以下の基準を満たすツールを選びましょう。

    • AI学習への非利用を明記
    • データの暗号化(通信・保存)
    • ファイルの自動削除
    • ウイルススキャン
    • ユーザー単位のデータ分離

    じたん翻訳のシークレットモードは、これらの基準を重視しつつ、翻訳データがAIの学習に使われない設定で処理します。機密文書の翻訳にお悩みの方は、まずは無料の100チケットでシークレットモードをお試しください。

    じたん翻訳を無料で試す

    FAQ

    Q1. Google翻訳に入力したテキストは本当にAI学習に使われますか?

    Google翻訳の利用規約では、サービス改善のためにデータを利用する可能性が示されています。機密性の高いテキストの入力は避けることを推奨します。規約の確認が必要です。

    Q2. シークレットモードと通常モードの翻訳精度に違いはありますか?

    いいえ、翻訳精度に違いはありません。シークレットモードは翻訳データがAIの学習に使われない設定にするだけで、翻訳エンジン自体は同じものを使用しています。

    Q3. じたん翻訳ではどのようなファイル形式に対応していますか?

    PDF、PPTX(PowerPoint)、Word(.docx)、Excel(.xlsx)に対応しています。PowerPointはフォーマットを保持したまま翻訳するため、デザインの再調整が不要です。

    Q4. 無料枠でもシークレットモードを使えますか?

    はい、使えます。新規登録時に付与される100チケットの無料枠でも、シークレットモードを含むすべての機能をご利用いただけます。

  • 翻訳ツールのセキュリティ完全ガイド|無料版は本当に危険?

    翻訳ツールのセキュリティ完全ガイド|無料版は本当に危険?

    翻訳ツールのセキュリティ完全ガイド|無料版は本当に危険?

    翻訳ツールは仕事に欠かせないツールとなりましたが、「無料版を使ってもセキュリティ上問題ないのか」と疑問に思ったことはありませんか?結論から言えば、無料/有料にかかわらず、規約・データ利用・保存期間・削除方針を確認することが重要です

    本記事では、翻訳ツールのセキュリティリスクを網羅的に解説し、安全なツールの選び方をガイドします。

    翻訳ツールの5つのセキュリティリスク

    翻訳ツールを利用する際、以下の5つのリスクを理解しておく必要があります。

    リスク1:AI学習データへの利用

    最も見落とされがちなリスクです。学習利用の有無は、サービスごと・プランごとに異なります。利用規約の細かい文字に「サービス改善のためにデータを利用する」といった記載がある場合、あなたの機密情報がAIの学習に使われる可能性があるため、規約を確認することが推奨されます

    一度AIの学習データに組み込まれた情報は、理論上は他のユーザーの翻訳結果に間接的に現れる可能性があります。これを「モデル記憶(memorization)」と呼びます。

    リスク2:データの保存期間不明確

    無料ツールの多くは、入力データの保存期間を明示していません。翻訳完了後もデータがサーバーに残り続ける場合、情報漏洩の窓が開いたままになります。サーバー侵害、内部不正、法的要請による開示など、保存されているデータが漏洩する経路は複数あります。

    リスク3:通信の暗号化不足

    HTTPSでの通信暗号化は標準的ですが、一部の翻訳ツールやAPI経由で利用する場合は、通信経路の暗号化が不十分なケースがあります。特に、無料のプロキシサービスやブラウザ拡張機能を経由する翻訳ツールは注意が必要です。

    リスク4:ファイルアップロード時のマルウェアリスク

    ファイルをアップロードして翻訳する場合、そのファイルが適切にスキャンされているかが重要です。ウイルススキャンなしでファイルを受け付けるサービスは、マルウェアの媒介になる可能性があります。また、他のユーザーのファイルと同じストレージに保存される場合、クロスコンタミネーションのリスクもあります。

    リスク5:アクセス制御の不備

    無料版では、適切なアクセス制御が実装されていない場合があります。ユーザー認証が甘い、ファイルのURLが推測可能、他のユーザーの翻訳結果が見える——こうした事態は実際に発生しています。

    無料版と有料版の違い

    無料版と有料版(プロ版)では、セキュリティ面で大きな違いがあります。

    項目 無料版 有料版・プロ版
    AI学習への利用 利用する可能性 非利用を明記することが多い
    データ保存 期間不明確 明確な保存期間・自動削除
    暗号化 HTTPSのみ 通信+保存データの暗号化
    ファイルサイズ 5〜10MB 15〜20MB以上
    アクセス制御 基本的 ユーザー単位のデータ分離
    監査ログ なし 操作ログの記録

    ただし、有料版だからといって自動的に安全とは限りません。利用規約を自分で確認することが重要です。

    企業が確認すべき5項目

    企業で翻訳ツールを導入する際、以下の5項目を必ず確認してください。

    1. 利用規約の「データ利用」条項

    利用規約の中で「データをサービス改善に利用する」「第三者提供の可能性」などの記載がないかを確認します。機密文書を扱う場合は、「入力データを学習に利用しない」ことが明記されていることが必須です。

    2. データの保管場所と法令

    データがどの国のサーバーに保存されるかを確認します。EUのGDPR、日本の個人情報保護法など、適用される法令が異なります。日本国内のサーバーで処理されることが望ましいです。

    3. インシデント対応体制

    データ漏洩が発生した場合の通知フロー、対応体制、責任の所在を確認します。「セキュリティインシデントの通知を何日以内に行うか」が明記されているかも重要です。

    4. 認証とアクセス制御

    多要素認証(MFA)に対応しているか、ユーザーごとのアクセス権限設定ができるかを確認します。組織で利用する場合は、管理者が利用状況を把握できるダッシュボードの有無も重要です。

    5. データの削除・消去

    翻訳完了後にデータが確実に削除される仕組みがあるかを確認します。手動削除だけでなく、自動削除の仕組みがあることが理想です。じたん翻訳では、翻訳完了後にファイルを自動削除し、AWS S3のサーバー側暗号化でデータを保護しています。

    安全なツールの選び方

    セキュリティを重視して翻訳ツールを選ぶ際のチェックリストをまとめます。

    • AI学習非利用の明記:利用規約で明確に「学習に利用しない」と書かれているか
    • シークレットモード:ワンクリックで学習利用を無効化できるモードがあるか
    • ファイル自動削除:翻訳後にデータが自動消去されるか
    • 暗号化:通信(HTTPS)と保存データ(S3暗号化など)の両方が暗号化されているか
    • ウイルススキャン:ClamAVなどでアップロードファイルを自動検査しているか
    • データ分離:ユーザーごとにファイルが分離されているか

    じたん翻訳はこれらの項目を重視して設計しています。特に「シークレットモード」は、翻訳データがAIの学習に使われない設定で処理する機能で、機密文書の翻訳に向いています。

    セキュリティチェックの手順

    1. 利用規約のPDFをダウンロード

    2. 「データ」「学習」「第三者提供」「改善」で検索

    3. 該当条項を読んでリスクを評価

    4. 不明点はサポートに問い合わせ

    5. 社内の情報セキュリティ担当と共有

    まとめ

    翻訳ツールには、AI学習へのデータ利用、保存期間の不明確さ、暗号化不足、マルウェアリスク、アクセス制御の不備といったセキュリティリスクの可能性があります。無料/有料にかかわらず、企業で利用する場合は、利用規約の確認、データ保管場所、インシデント対応、認証、データ削除の5項目を必ずチェックしましょう。

    じたん翻訳を無料で試す(100チケット付与)

    FAQ

    Q1. すべての無料翻訳ツールが危険というわけですか?

    すべてが危険ではありませんが、無料/有料にかかわらず、規約・データ利用・保存期間・削除方針を確認することが重要です。

    Q2. 個人利用でもセキュリティは気にすべきですか?

    はい。個人情報、パスワード、クレジットカード番号などを翻訳ツールに入力するのは避けてください。これらの情報が学習データに使われるリスクがあります。

    Q3. じたん翻訳のシークレットモードはどのように機能しますか?

    シークレットモードを有効にすると、翻訳データがAIの学習に使われない設定で翻訳処理を行います。処理完了後、入力データはサーバーから完全に削除されます。翻訳精度は通常モードと同じです。

    Q4. 企業で翻訳ツールを導入する場合、誰が確認すべきですか?

    情報セキュリティ担当者と法務担当者の両方に確認してもらうことを推奨します。利用規約の法的側面は法務、技術的なセキュリティ面は情報セキュリティ担当の領域です。


    関連記事

  • 【2026年最新】PDF翻訳ツール比較|レイアウト保持・OCR・セキュリティで選ぶ

    【2026年最新】PDF翻訳ツール比較|レイアウト保持・OCR・セキュリティで選ぶ

    【2026年最新】PDF翻訳ツール比較|レイアウト保持・OCR・セキュリティで選ぶ


    結論:PDF翻訳は「読むだけ」か「業務で戻すか」で選ぶ

    PDF翻訳で失敗しないための3つのポイントを先にまとめます。

    1. 内容をざっと読むだけなら、Google翻訳やDeepLの無料機能で十分なことが多い
    2. レイアウトを保ったまま社内外で配布・再編集するなら、ファイル翻訳に特化したサービスが適している
    3. スキャンPDFや機密文書を扱う場合は、OCR対応とセキュリティ方針を必ず確認する

    PDF翻訳ツールは数多くありますが、実務で困るのは「翻訳精度」より「翻訳後にどれだけ手直しが必要か」です。この記事では、主要なPDF翻訳ツールをレイアウト保持、OCR、ファイルサイズ制限、セキュリティ、料金の5軸で整理し、用途に合った選び方を解説します。


    PDF翻訳ツールを選ぶ5つの基準

    PDF翻訳では、単に「日本語に変換できるか」だけでなく、以下の5点を押さえておくと後悔しにくくなります。

    1. レイアウト保持

    図表、段組み、箇条書き、脚注が崩れると、翻訳後の修正に想像以上の時間がかかります。特に提案書、仕様書、マニュアルなど「そのまま配る」資料では、レイアウト保持が最も重要な比較軸になります。

    2. OCR(スキャンPDF)対応

    文字をドラッグで選択できる「テキストPDF」と、紙をスキャンした「画像PDF」では、翻訳の仕組みが根本的に異なります。画像PDFはOCRで文字を抽出してから翻訳するため、OCRの品質が翻訳結果に直結します。申請書や古いマニュアルなどはこのパターンに該当しやすく、OCR非対応のツールでは翻訳自体ができません。

    3. ファイルサイズ制限

    無料ツールにはファイルサイズの上限があります。業務で扱うPDFは数十ページ、数十MBになることも多く、制限に引っかかると分割や圧縮の手間が発生します。普段扱うファイルサイズを想定して選ぶことが大切です。

    4. セキュリティ(AI学習データ利用)

    契約書、見積書、社内資料などを翻訳する場合、入力したデータがAIの学習に使われるかどうかは確認すべきポイントです。特に無料版では、利用規約で学習利用を許可しているサービスがあります。機密文書を扱うなら、学習利用なしのモードや、ファイルの自動削除ポリシーを確認しましょう。

    5. 料金体系

    無料で済むか、月額か、従量課金かによって、継続利用時のコスト感が変わります。月に数回しか使わない人と、毎日数十ファイルを処理する人では、最適な料金モデルが異なります。


    主要PDF翻訳ツール比較表

    2026年時点で代表的なPDF翻訳ツールを5軸で比較しました。

    ファイルサイズ制限の比較

    ツール 無料プランの制限 有料プランの制限 備考
    Google翻訳 10MB / 300ページまで なし(無料のみ) ドキュメント翻訳機能の制限
    DeepL 5MB / ファイル3つまで Pro: 15MB / ファイル制限緩和 Free版は機能制限が大きい
    Adobe Acrobat PDF変換のみ無料 Acrobat Pro: 容量制限はあるが大きい 翻訳はMicrosoft Translator連携等
    みらい翻訳Plus 無料枠あり プラン別に文字数制限 OCRは一部プランで対応
    じたん翻訳 100チケット無料(約25,000文字分) 最大50MB テキストPDF・画像PDF両対応

    レイアウト保持・OCR・セキュリティの比較

    ツール レイアウト保持 OCR(スキャンPDF) AI学習データ利用 主な出力形式
    Google翻訳 弱い(表や段組みで崩れやすい) 非対応 利用規約要確認 PDF(Googleドキュメント経由)
    DeepL 弱め〜中程度 非対応 Free版は学習利用の可能性 PDF / PPTX / DOCX
    Adobe Acrobat 中程度(PDF編集に強い) Acrobat ProでOCR内蔵 利用規約要確認 PDF
    みらい翻訳Plus 中程度 一部プランで対応 学習利用について公式確認要 PDF / DOCX / PPTX
    じたん翻訳 構造維持を重視(PowerPoint/Word/Excel) 画像PDFをOCR経由で対応 学習利用なし(API提供元の公式方針に基づく) テキストPDF→Word / 画像PDF→PDF

    補足: じたん翻訳はAI翻訳エンジンを利用しており、API提供元のデータガバナンス方針に基づき「プロンプトや応答をモデルの学習に使用しない」前提で運用しています。


    無料PDF翻訳ツールの制限まとめ

    無料でPDFを翻訳できる代表的な手段と、その制限を整理します。

    Google翻訳(ドキュメント翻訳機能)

    • サイズ上限: 10MB
    • ページ上限: 300ページ
    • スキャンPDF: 非対応(画像内テキストは翻訳されない)
    • レイアウト: 表、段組み、画像の配置が崩れやすい
    • 向いている用途: とにかく無料で内容をざっと読みたいとき

    DeepL(Free版)

    • サイズ上限: 5MB
    • ファイル数: 一度に3ファイルまで
    • 対応形式: PDF、PPTX、DOCX、XLSX(Free版は制限あり)
    • スキャンPDF: 非対応
    • 向いている用途: 自然な日本語で読みたいとき、短い文書の内容確認

    ブラウザ標準翻訳

    ChromeやEdgeでPDFを開き、標準翻訳機能を使う方法です。手軽ですが、これはファイル翻訳ではなく「画面上のテキストを翻訳している」に近い挙動になります。翻訳結果を保存・再利用する用途には向きません。

    無料ツールの共通する制限:

    • スキャンPDF(画像PDF)は翻訳対象外のことが多い
    • 表や図表のレイアウトが崩れやすい
    • 配布前提の仕上がりにはならない
    • AI学習データとして使われる可能性がある

    スキャンPDF(画像PDF)の翻訳に対応しているツール

    文字を選択できないPDFは、OCR(光学式文字認識)を経由しないと翻訳できません。スキャンした契約書、紙のマニュアルをPDF化した資料、FAXのPDFなどが該当します。

    ツール スキャンPDF対応 OCR品質 備考
    Adobe Acrobat Pro 対応 高い PDF編集のデファクトスタンダード。OCR後に翻訳
    みらい翻訳Plus 一部対応 中程度 プランによってOCR可否が異なる
    じたん翻訳 対応 AIベースOCR 画像PDFはOCR経由でPDF出力。テキストPDFはWord出力
    Google翻訳 非対応 文字抽出できないPDFは対象外
    DeepL 非対応 同上

    スキャンPDFを扱う機会が多い場合は、OCR対応を最初から確認しておくことで、ツール選びで迷わなくなります。


    ビジネス用途での選び方

    PDF翻訳をビジネスで使う場合、以下のフローで判断すると迷いにくいです。

    ステップ1: PDFの種類を確認する

    • 文字をドラッグで選択できる → テキストPDF
    • 選択できない → 画像PDF(スキャンPDF)

    ステップ2: 用途を分ける

    用途 おすすめのアプローチ
    内容をざっと読みたいだけ Google翻訳・DeepLなどの無料ツール
    社内共有用にレイアウトを保って翻訳したい ファイル翻訳サービス(レイアウト保持重視)
    顧客提出・配布資料として使いたい レイアウト保持+セキュリティ確認済みのサービス
    スキャンPDFを翻訳したい OCR対応サービス
    機密文書・契約書を扱いたい AI学習利用なし・自動削除ポリシーを確認

    ステップ3: 翻訳後の修正工数も見積もる

    「無料で翻訳できた」けど「レイアウト修正に2時間かかった」というケースは少なくありません。翻訳精度だけでなく、翻訳後にどれだけ手直しが必要かまで含めて判断すると、実務上の失敗を減らせます。


    じたん翻訳のPDF翻訳について

    じたん翻訳は、PowerPoint、PDF、Word、Excelに対応したファイル翻訳サービスです。PDFについては、テキストPDFと画像PDF(OCR)で処理系が分かれています。

    PDF翻訳の特徴

    • テキストPDF: 翻訳後はWord(.docx)出力。再編集しやすい形式で提供
    • 画像PDF(スキャンPDF): OCRを経由して翻訳後もPDF出力
    • 3段階翻訳: 文脈理解→一次翻訳→ブラッシュアップの3段階で処理。用語の一貫性と文脈のつながりを保ちながら翻訳します
    • 最大50MB対応: 業務で扱う大きめのファイルにも対応
    • セキュリティ: AI翻訳エンジンの公式方針に基づき、入力データをAI学習に利用しません。ファイルはAWS S3で暗号化保存し、ウイルススキャンを実施後、一定期間で自動削除

    新規登録時に100チケット(日本語翻訳なら約25,000文字分)が無料で付与されるため、まずは小さめのPDFで試して、レイアウト保持や翻訳品質を確認できます。


    まとめ:PDF翻訳ツールは「用途」と「制限」で選ぶ

    やりたいこと まず試すべき手段 次のステップ
    無料で内容だけ読みたい Google翻訳・DeepL レイアウト崩れが気にならなければそのまま
    レイアウトを保って業務で使いたい ファイル翻訳サービス 無料トライアルで実際のファイルを試す
    スキャンPDFを翻訳したい OCR対応サービス OCR品質を実際のファイルで確認
    機密文書を安全に翻訳したい セキュリティ方針が明確なサービス AI学習利用・削除ポリシーを確認

    PDF翻訳ツールは「無料か有料か」ではなく、「翻訳後にどれだけ手間がかかるか」で選ぶのが一番失敗しにくいアプローチです。まずは内容確認から無料ツールで入り、実際のファイルで「直しが多い」「配布しづらい」と感じたら、ファイル翻訳サービスへの切り替えを検討してみてください。


    FAQ:PDF翻訳ツールについてよくある質問

    PDFは無料で日本語訳できますか?

    内容確認までなら可能です。Google翻訳やDeepLの無料機能で読むことはできます。ただし、レイアウト保持、スキャンPDF対応、配布前提の仕上がりまで求める場合は、無料ツールだけでは対応しきれない場面があります。

    スキャンPDF(画像PDF)もそのまま翻訳できますか?

    画像ベースのPDFはOCR(光学式文字認識)が必要です。OCR非対応のツールでは文字を抽出できないため、翻訳自体ができません。Adobe Acrobat Proやじたん翻訳など、OCR対応を明記しているサービスを選んでください。

    翻訳ツールに機密文書をアップロードしても大丈夫ですか?

    サービスごとにセキュリティ方針が異なります。無料版ではAI学習に利用される可能性があるため、利用規約で「学習に利用しない」ことが明記されているか、学習利用なしのモード(シークレットモード等)があるかを確認することが重要です。

    PDF翻訳で一番失敗しやすいポイントは何ですか?

    「翻訳できたが、レイアウトが大きく崩れて修正に時間がかかった」というケースが最も多いです。特に表、段組み、図表を含むPDFでは、無料ツールで翻訳した後に手作業で整え直す手間が予想以上にかかることがあります。

    じたん翻訳の無料ポイントでどのくらい翻訳できますか?

    新規登録時に100チケットが付与されます。日本語への翻訳の場合、約25,000文字分に相当します。A4数枚程度のPDFであれば、無料ポイントの範囲内で試すことができます。


    関連記事


    じたん翻訳を無料で試す(100チケット付き)

    新規登録で100チケットが付与されます。実際のPDFファイルでレイアウト保持、OCR対応、翻訳品質を確認できます。まずは小さめのファイルからお試しください。

    じたん翻訳を無料で試す