Googleの文字起こしは2026年5月時点で何が使える?
直接回答:個人用途で無料で使えるのは(1)Googleドキュメントの音声入力、(2)Pixel端末の録音アプリ、の2つ。Google Meetの自動文字起こしはWorkspaceの上位プラン、Cloud Speech-to-TextはAPIで従量課金です。
4機能の使い分け
「自分1人が話す内容を文字化」したいなら音声入力かPixel録音アプリで充分。会議全体を起こすならGoogle Meet+Gemini、システム連携で大量バッチを処理するならCloud Speech-to-Text APIが必要になります。
Googleの音声認識精度の現状
2026年5月時点の日本語精度はWER(単語誤り率)で5〜15%。クリアな1人音声なら5〜10%、複数人会議では10〜15%が現実値。NottaやCLOVA Noteと比較しても遜色ないレベルです。
主要4機能スペック早見表
直接回答:Googleドキュメント音声入力は完全無料、Pixel録音アプリも端末標準で無料、Google Meet+Geminiは月$30/シートのWorkspace Business Plus以上、Cloud Speech-to-Textは1分あたり$0.024(約3.7円)の従量課金です。
Google音声テキスト化機能比較表
・機能 / 月額 / 入力 / 話者分離 / 要約 / 用途
・Googleドキュメント音声入力 / 無料 / マイク / なし / なし / 1人ディクテーション
・Pixel録音アプリ / 無料(端末代別) / マイク / あり / あり(Gemini) / 個人録音
・Google Meet(Gemini) / Workspace $30〜 / 会議音声 / あり / あり / 会議自動議事録
・Cloud Speech-to-Text / $0.024/分 / API / オプション / なし / システム連携
注: 1USD=155円。価格は2026年5月時点の参考値で公式は要確認。
1分で選ぶ判定軸
(1)1人で話す→Googleドキュメント音声入力、(2)外出先のメモ→Pixel録音アプリ、(3)会議全体→Google Meet+Gemini、(4)バッチ処理→Cloud API。
用途別の最適解
直接回答:個人ディクテーションはGoogleドキュメント音声入力、外出先のメモはPixel録音、社内会議はGoogle Meet(Workspace上位プラン)、開発者の自動化はCloud Speech-to-Text、と用途で住み分けます。
1人社長: ブログ記事の口述から始める
Googleドキュメント音声入力で「思ったことを話す→自動で文字化→ChatGPTで整文」のフローを組むと、A4 1枚の記事が10分で書けます。月額0円、Chromeブラウザで完結する手軽さが武器。
営業職: Pixel端末を業務携帯に
Pixel 8以降の録音アプリは、録音→自動文字起こし→Gemini要約までスマホ1台で完結。商談録音→帰社して10分でCRMに入力、というフローが組めます。
中小企業のDX担当: Workspace+Gemini導入
Workspace Business Plus(月$30/シート)でGoogle Meetの自動文字起こしを解禁。20名のチームなら月$600(約93,000円)のコストですが、議事録作成時間の削減で月50時間規模の時短が見込めます。
開発者: Cloud Speech-to-Text APIで自動化
1分$0.024で、月100時間(6,000分)処理しても$144(約22,300円)。NottaやAutoMemoのSaaSコストより安く済む規模になります。話者分離を有効化すると単価が上がるため要設計です。
専用ハードを併用する選択肢は別記事「AI文字起こしレコーダー」を参照してください。
無料で使う具体的な手順
直接回答:Googleドキュメントを開く→「ツール → 音声入力」→マイクアイコンクリック→話す。これだけで完全無料の文字起こしが回ります。Chromeブラウザ必須。
Googleドキュメント音声入力の手順
(1)Googleアカウントにログイン、(2)ドキュメントを新規作成、(3)上部メニュー「ツール → 音声入力」、(4)マイクアイコンをクリックすると言語選択(日本語)、(5)録音開始→話す。句読点は「マル」「テン」と発音すると自動で挿入されます。
Pixel録音アプリの使い方
Pixel 8以降の標準アプリ「レコーダー」を起動→録音ボタン。録音と同時に文字起こしが進み、終了後にGeminiが自動で要約・タイトル・タグを生成。クラウド同期でPCのGoogleドキュメントから編集も可能。
制限事項とフィット感
(1)バックグラウンドで他作業をすると録音が止まる、(2)2時間連続が限界、(3)複数話者の話者分離はできない、の3点が制限。1人で30分話す用途には完璧ですが、4人会議の起こしには向きません。
GoogleとClaudeを連携した「会議自動議事録」フロー
直接回答:Google MeetまたはPixelで録音→Googleドキュメントに転送→Claudeに「議事録テンプレで整文」と依頼。月コスト0円〜30ドルで、議事録作成時間が30分→3分に圧縮できます。
5ステップフロー
(1)会議をGoogle Meetで開催(無料アカウントで60分制限あり)、(2)Workspace上位プランなら自動文字起こし、無料なら録画→Whisper APIで起こす、(3)テキストをGoogleドキュメントに貼る、(4)Claudeに「決定事項3つ・ToDo・未解決論点でMarkdownにまとめて」と依頼、(5)整文済み議事録をSlackに投稿。
コスト試算
無料: Pixel録音→Googleドキュメント→Claude Free 有料: Workspace $30+Claude Pro $20=$50(約7,750円)/月で完全自動化
月50時間の議事録作業が5時間に圧縮できれば、時給5,000円換算で月22.5万円のリターン。
自動化を進めるならMCP連携
Claude Codeでgoogle-meetのMCPサーバーをセットアップすると、会議終了後にClaudeが自動で議事録化→Slack投稿、という完全自動化が組めます。月の議事録手作業をゼロにできる構成です。
よくある質問(FAQ)
Q1. Google Meetの自動文字起こしは無料アカウントで使えますか?
A. 使えません。2026年5月時点でGoogle Meetの自動文字起こしはWorkspace Business Plus以上の有料機能です。無料で代用するならPixel録音またはClaude+OBS録画→Whisper APIの組み合わせが現実解です。
Q2. Googleドキュメント音声入力の精度は?
A. 日本語クリア音声でWER 5〜10%程度。Notta・CLOVA Noteと近い水準です。専門用語・固有名詞での誤認識は手動修正が必要。
Q3. Cloud Speech-to-Text APIは個人で使えますか?
A. 使えます。Google Cloudアカウントを作成し、APIを有効化、APIキーを発行するだけ。クレジットカード登録は必要ですが、月60分の無料枠があります。
Q4. 録音した会議データの保存場所は?
A. Pixel録音はGoogleアカウントのレコーダーフォルダに自動保存、Google Meetの録画はDriveに保存。各社のデータポリシーで保存期間が決まります。
Q5. 機密会議でGoogleの文字起こしを使っても安全ですか?
A. Workspace Business以上はデータ非学習が標準、個人アカウントは設定で確認が必要。機密度が高い場合は、ローカル処理のWhisper(OpenAI公開モデル)の自前運用が安全です。
まとめ + CTA
GoogleのAI文字起こしは2026年5月時点で「個人無料はGoogleドキュメント音声入力+Pixel録音、法人は Workspace Business Plus、開発者は Cloud Speech-to-Text API」の3階層に整理されます。
Notta・CLOVA Noteとの比較では「機能で勝る点」と「無料で勝る点」が両立しており、Workspaceユーザーなら最初の選択肢に値します。Claudeとの連携で完全自動議事録フローも組めるため、月50時間の時短も現実的です。
同じトピックでさらに深掘りしたい方は、関連記事「AI文字起こしレコーダー」もあわせてどうぞ。
X(@yoshio_nocode)では、AI×ノーコード×スモビジで時給を上げる実践ネタを毎日発信中。Google・Claude・ChatGPT・Geminiの最新文字起こし機能を最速でこちらにまとめます。フォローしてください。
