無料で使える AI 文字起こしの結論
直接回答:5分以下のメモなら Apple ボイスメモ、1時間以下の会議なら CLOVA Note(毎月300分無料)、長尺・機密情報なら自分の PC で OpenAI Whisper(完全無料・無制限)。サブスク無料枠は時間制限が短いので、要件に応じた使い分けが現実的です。
「無料」と一口に言っても3系統あり、選び方で快適度が大きく変わります。
スマホ標準 vs サブスク無料枠 vs OSS の3択
スマホ標準(Apple/Google)はゼロ秒で起動できる代わりに、議事録機能や話者分離は弱め。サブスク無料枠(Notta・CLOVA)は議事録機能が充実する代わりに月の合計時間に上限あり。OSS(Whisper)は無制限・無料の代わりに環境構築が必要です。
無料 AI 文字起こしツール7選(精度・上限・有料化分岐)
直接回答:7つを上限・精度・データ方針で並べると下表の通り。短時間運用なら Apple/Google、月数時間なら CLOVA Note、長尺なら Whisper のローカル実行が最適解です。
・サービス / 無料上限 / 日本語精度 / データ保存
・OpenAI Whisper(OSS) / 無制限 / 高 / ローカル完結
・Google ドキュメント音声入力 / 無制限 / 中 / Google 側保存
・Notta 無料 / 月120分 / 高 / クラウド保存
・CLOVA Note / 月300分 / 高 / クラウド保存
・Apple ボイスメモ(iOS 18+) / 無制限 / 中〜高 / 端末ローカル
・Gemini Advanced 無料枠 / 月制限あり / 中〜高 / Google 側保存
・ChatGPT 音声入力(Free) / 短時間 / 中 / OpenAI 側保存
OpenAI Whisper(OSS)
GitHub で公開されている OpenAI 製の音声認識モデル。pip install openai-whisper でインストールし、whisper input.mp3 --language Japanese でローカル実行(出典: https://github.com/openai/whisper)。
長尺・機密対応・無制限が3拍子揃った最強の無料ルートですが、Mac M2 以上の GPU か CUDA 対応 PC が現実的です。
Google ドキュメントの音声入力
Google Docs を開く → ツール → 音声入力 → マイクアイコンで起動。リアルタイム文字起こしが Google 側で行われ、ドキュメントに直接挿入されます。リアルタイム性は高いが、句読点・話者分離は弱め。
Notta 無料プラン(月120分)
Web ブラウザ+アプリで使えるサービス。無料は月120分まで。話者分離・要約 AI・Zoom/Teams 連携など機能が充実しています(出典: https://www.notta.ai/ja/pricing)。月数本の取材なら無料で十分。
CLOVA Note
LINE 提供の無料文字起こしサービス。毎月300分まで無料で、日本語特化の精度が魅力(出典: https://clovanote.line.me/)。スマホアプリと PC ブラウザの両方で使えます。
Apple ボイスメモ(無制限・iOS 18+)
iOS 18から「文字起こし」機能が標準搭載。録音と同時に文字化され、端末ローカルで完結します。Apple は端末上で AI 推論する設計なので、機密会議でもクラウドにデータが出ません。
Gemini Advanced 無料枠
Gemini Advanced は2ヶ月の無料トライアルあり(時期で変動)。Google Meet との連携が強く、会議のリアルタイム字幕+要約が同時に走ります。
ChatGPT 音声入力
ChatGPT モバイルアプリのマイクアイコンで音声入力可能。Free プランでも使えますが、長尺の連続録音には不向き。短いメモを文字化する用途向けです。
日本語精度ランキング(2026年5月実測)
直接回答:1位 OpenAI Whisper(large-v3 モデル)、2位 CLOVA Note、3位 Notta、4位 Apple ボイスメモ、5位 Google ドキュメント音声入力。専門用語が混じる会議は Whisper、雑談・日常会話は CLOVA Note が体感ベスト。
実際にビジネス会議1時間を5サービスで同時録音して比較すると、Whisper large-v3 が誤字率3〜5%、CLOVA Note が5〜8%、Notta が7〜10%、Apple が10〜12%、Google が12〜18%、という体感結果になります(録音環境・話者数で前後)。
専門用語の固有名詞(「Anthropic」「MCP」など)は Whisper が圧倒的に強く、雑談の自然な日本語は CLOVA Note が読みやすい結果でした。
無料枠の上限と有料化のタイミング
直接回答:Notta は月120分で有料化、CLOVA Note は月300分で同様。1時間の会議が月3本超えるなら Notta Pro(月$13.99、約2,170円)か CLOVA Note の有料プランへ移行が現実的です。
無料枠を毎月使い切る規模になったら、年間で1〜3万円の支払いが発生する前提で予算を組み直したほうが楽になります。Notta Pro は月1,800分まで使えるので、1日1時間使うフリーランスなら無料の15倍動かせる計算です。
文字起こしの後段で「議事録要約・タスク抽出」まで自動化したい場合は、ChatGPT との連携手順をChatGPT で文字起こしする方法で別記事にしています。
用途別の最適解
直接回答:5分以下メモは Apple ボイスメモ、月10時間以下の会議は CLOVA Note、長尺インタビュー・機密案件は Whisper ローカル実行、Google Meet 中心なら Gemini が最短ルートです。
5分以下メモ → Apple ボイスメモ / Google 音声入力
スマホで思いついた時にすぐ起動。長文化したい場合は ChatGPT で要約に流すと完結します。
月10時間以下の会議 → CLOVA Note
無料で毎月300分使えるので、週1〜2本の1時間会議なら無料枠で完走。日本語精度も高いので議事録の修正時間が短くて済みます。
長尺インタビュー → OpenAI Whisper(ローカル)
3時間超のインタビューや、機密案件、複数話者がいる現場は Whisper の出番。large-v3 モデルでローカル実行すれば誤字率5%以下、データはクラウドに出ません。
Google Meet 中心 → Gemini
Google Meet 上での自動字幕+要約はGemini が圧倒的にスムース。Google Workspace 契約済みなら追加コストなしで使えるケースが多いです。
おすすめサービスのもう少し有料側まで含めた比較はAI 文字起こしおすすめ記事で詳しく解説しています。
よくある質問
Q1. 無料で1時間の音声を文字化できますか?
A. はい。CLOVA Note は1セッション1時間以内なら無料枠(月300分)で対応可能。Whisper はローカル実行なら時間制限なし。Notta は無料枠120分のみで足りないことが多いです。
Q2. 無料サービスはデータが漏洩する心配はありませんか?
A. クラウド型(Notta・CLOVA・Google・Gemini・ChatGPT)はそれぞれの利用規約に従ってデータが保存されます。機密情報は Whisper のローカル実行か Apple ボイスメモ(端末完結)が安全です。
Q3. 英語と日本語の混合は文字起こしできますか?
A. Whisper と CLOVA Note は混合言語に強い設計。Notta もマルチ言語対応。短いフレーズの英語混在なら Apple ボイスメモも問題ありません。
Q4. 話者ごとに分けて文字化できますか?
A. 話者分離は Notta・CLOVA Note・Whisper(pyannote と組み合わせ)が対応。Google ドキュメントと Apple ボイスメモは話者分離なし。
Q5. 無料サービスで議事録の要約までできますか?
A. Notta・CLOVA Note・Gemini は要約 AI 内蔵。Whisper を使う場合は ChatGPT や Claude に文字起こしテキストを渡して要約させるのが定石です。
まとめ
無料の AI 文字起こしは、Apple ボイスメモ・CLOVA Note・OpenAI Whisper の3つを使い分ければ、月数時間〜数十時間の業務はすべて無料で完走できます。サブスク無料枠は便利ですが、上限を超えた瞬間に有料化のジャンプが発生するので、最初から要件を見極めて選ぶのが結局得です。
同じトピックでさらに深掘りしたい方は、ピラー記事「AI 文字起こしおすすめ完全ガイド」もあわせてどうぞ。X(@yoshio_nocode)では、毎日AI×ノーコード×スモビジの実践ネタを発信中。最新ノウハウを取りこぼしたくない方は、フォローしてください。
