実務活用2026.05.02AI経営実践ラボ編集部

ChatGPT で文字起こし 議事録作成の完全手順【2026年5月】

ChatGPT で音声ファイルを文字起こしし、議事録要約まで一気通貫で作る手順を、Plus / API 両方のルートで解説。Whisper API・GPT-5 の使い分けと精度・コストを2026年5月時点でまとめました。

GPT-5.x8分
ChatGPT で文字起こし 議事録作成の完全手順【2026年5月】
GPT-5.x実務活用記事一覧

この記事の要点

3行で言うと

  • AI 文字起こし ChatGPT で議事録要約まで一気通貫で作るには、ChatGPT Plus の音声入力・Whisper API・カスタム GPT の3ルートを使い分けます。
  • それぞれ精度・コスト・対応時間が違い、選び方を間違えると「1時間の音声が文字化できない」「想定の3倍の API 料金がかかった」といった事故が頻発。
  • AI 文字起こし ChatGPT のルート選択を間違えると、料金もスピードも非効率になりがち。
この記事の目次開閉

AI 文字起こし ChatGPT でできるのか?

直接回答:できます。ChatGPT Plus($20/月)のモバイルアプリで音声入力+文字化、Whisper API($0.006/分)でファイル文字化、カスタム GPT で会議録音アップロードの3ルートがあります。1時間の音声なら API ルートで$0.36(約56円)程度です。

ChatGPT 自体は OpenAI の音声認識モデル「Whisper」をバックエンドに使っているので、文字起こし精度は専用ツール(Notta・CLOVA Note)と遜色ありません。

ChatGPT 全般の概要を先に知りたい方はChatGPT とはを参照してください。

ChatGPT で文字起こしする3ルート

直接回答:短時間メモは ChatGPT Plus の音声入力(無料 / Plus)、長尺ファイルは Whisper API(従量課金)、社内テンプレ込みならカスタム GPT。所要時間と料金で使い分けるのが2026年5月の最適解です。

ルート1: ChatGPT Plus 音声入力(モバイル)

ChatGPT モバイルアプリのマイクアイコンで音声入力 → そのまま会話に流す。録音時間は1メッセージあたり数分が目安。Plus $20/月で使い放題、Free でも限定的に使えます(出典: https://openai.com/chatgpt/pricing/)。

ルート2: Whisper API + ChatGPT 要約

OpenAI Platform で API キーを発行 → Python や cURL で MP3/WAV ファイルを Whisper API($0.006/分)に投げる → テキストを取得 → ChatGPT API(GPT-5)で要約。1時間音声なら文字起こし$0.36 + 要約$0.05 = 約$0.41(約64円)。

import openai

client = openai.OpenAI(api_key="sk-...")

with open("meeting.mp3", "rb") as audio:

transcript = client.audio.transcriptions.create(

model="whisper-1",

file=audio,

language="ja"

)

print(transcript.text)

ルート3: カスタム GPT(音声ファイルアップロード)

ChatGPT Plus の Custom GPT 機能で「会議録音を文字化+要約する GPT」を作成 → 音声ファイルを直接アップロード。コードを書かずに1時間音声を処理できます。Plus $20/月で使い放題。

ルート別の精度とコスト比較

・ルート / 月額 / 従量 / 1時間あたり / 日本語精度 / 長尺対応

・ChatGPT Plus 音声入力 / $20/月 / $0(定額) / 中〜高 / 短時間のみ

・Whisper API / $0.006/分 / 約$0.36(約56円) / 最高 / 制限なし

・カスタム GPT / $20/月 / $0(定額) / 高 / 25MB / 1ファイル

長尺ファイル(1時間超)は Whisper API、定額で済ませたいならカスタム GPT、サクッと音声メモなら音声入力、と用途で住み分けます。

議事録要約までのプロンプト設計

直接回答:「議題ごとのサマリ → アクションアイテム → 担当・期限」の3層構造で指示すると、すぐ Slack や Notion に貼れる議事録ができます。プロンプトをテンプレ化して保存しておくと、毎回1分で議事録化が完走します。

プロンプト例(基本形)

以下の会議文字起こしから、議事録を作成してください。

# 会議名: {会議名}

# 日付: 2026-05-02

出力形式

1. 議題ごとのサマリ(3〜5行ずつ)

2. 決定事項(箇条書き)

3. アクションアイテム(担当者・期限つき)

4. 次回までの宿題

文字起こし: {transcript}

プロンプト例(営業同行用)

「クライアント要望」「自社が出した提案」「次回までの宿題」の3項目に絞ると、営業マネージャーへのレポートが3分で完成します。

プロンプト例(社内会議)

「結論」「議論の経緯」「未解決事項」「決定事項」の4分類が、社内議事録のテンプレとして使い回せます。

機密情報を扱う際の注意点

直接回答:ChatGPT のデータ学習設定をオフにし、機密度の高い案件は Whisper をローカルで動かすのが安全です。OpenAI API は学習に使われない設計ですが、ログは30日保持されるので、超機密案件は OSS Whisper のローカル実行を選びます。

ChatGPT のデータ学習オフ設定

Settings → Data controls → Improve the model for everyone をオフ。これで自分の会話が今後の学習に使われません。

API 経由の場合の取り扱い

OpenAI API はデフォルトで学習に使われない設計です(出典: https://openai.com/policies/api-data-usage-policies/)。ただしログは最大30日保持されます。Zero Data Retention(ZDR)契約を結べばログ保持もゼロにできますが、エンタープライズ契約が必要です。

完全オフラインで処理する選択肢

機密度が極めて高い案件は、OpenAI Whisper の OSS 版をローカル PC で実行します。pip install openai-whisper でインストールし、ネット接続なしで処理可能(出典: https://github.com/openai/whisper)。Mac M2 以上の GPU なら1時間音声を5〜10分で処理できます。

完全無料・データ完全ローカルというルートも別記事AI 文字起こし無料7選で解説しています。

自社サーバー運用の選択肢

法人案件なら、自社の AWS / GCP インスタンスに Whisper を載せて、クライアントへの説明責任を担保する選び方もあります。月数万円のサーバー代で、データガバナンスを完全にコントロールできます。

よくある質問

Q1. 1時間の会議を ChatGPT で文字起こしできますか?

A. ChatGPT Plus のカスタム GPT 経由なら25MB制限内で可能。Whisper API ならファイルサイズ制限なし。1時間の音声で約$0.36(約56円)です。

Q2. ChatGPT モバイルの音声入力で長時間録音できますか?

A. 1メッセージあたり数分が上限。1時間の会議全体を1度に投げるのは現実的でない設計です。長時間は Whisper API かカスタム GPT が向きます。

Q3. 専用文字起こしサービスとどちらが安い?

A. 1時間の会議を月10本処理する想定なら、Whisper API は約$3.6(約560円)、Notta Pro は$13.99/月。利用頻度で逆転します。月3〜4本以下なら API、月10本以上なら専用サービスのほうが安い印象です。

Q4. リアルタイム文字起こしは ChatGPT でできますか?

A. ChatGPT モバイルの音声入力はリアルタイム文字化に対応。ただし複数話者の議事録には向きません。Notta や Tactiq のようなリアルタイム議事録特化ツールが現実的です。

Q5. ChatGPT で英語と日本語の混合は処理できますか?

A. はい。Whisper は混合言語に強く、language パラメータを指定しなければ自動判定で処理します。日英混在のミーティングでも体感95%以上の精度で動きます。

Q6. Whisper API でファイルサイズ制限はありますか?

A. 1ファイル25MBが上限です。1時間以上の長尺は MP3 圧縮(ビットレート64kbps)で1時間あたり約30MB → 25MB以下に収まる設計にするか、ffmpeg で15分単位に分割してから順次処理するのが定番です。

1人社長・副業フリーランスの実例フロー

直接回答:1人社長は Whisper API + GPT-5 要約で月$5〜10程度(約780〜1,550円)、副業フリーランスはカスタム GPT 経由で ChatGPT Plus $20の範囲内に収めるのが2026年5月時点の現実解です。

1人社長の場合、月10本ペースのクライアント取材+社内ミーティングが現実的なライン。Whisper API($3.6)+ ChatGPT API($0.5)= 月$4.1で完走できます。これなら年間$50(約7,800円)で年間120時間分の議事録を作る計算です。外注すれば1時間3,000円で年36万円、ROI で言えば50倍超のリターンになります。

副業フリーランスは月3〜5本のクライアント取材が現実的なライン。すでに ChatGPT Plus を契約済みなら、カスタム GPT 経由で追加費用ゼロで完結。「会議録音から議事録を作る」専用カスタム GPT を一度作っておけば、毎回プロンプト入力する手間も省けます。

まとめ

ChatGPT で文字起こしから議事録作成までを一気通貫で動かすには、Plus 音声入力(短時間)・Whisper API(長尺)・カスタム GPT(定額)の3ルートを使い分けます。月数本以下なら API 従量課金で$1未満、月10本以上なら専用サービス(Notta Pro)のほうが結果的に安い、というのが2026年5月時点の現実解です。

機密案件は OSS Whisper のローカル実行が最終解になります。Zapier や Make を組み合わせれば、議事録工数を月0分まで削れます。

同じトピックでさらに深掘りしたい方は、ピラー記事「ChatGPT 完全ガイド」もあわせてどうぞ。X(@yoshio_nocode)では、毎日AI×ノーコード×スモビジの実践ネタを発信中。最新ノウハウを取りこぼしたくない方は、フォローしてください。

タグ(5件):chatgpt 文字起こしwhisper apichatgpt 議事録chatgpt 音声 文字化openai whisper 使い方
もっと見る