ご自身のOpenAI APIキーで動く、サブスク不要の音声文字起こしアプリ。Whisper APIの精度をそのまま活かしながら、費用は使った分だけ。会議・インタビュー・講義の録音から、AI要約・議事録作成・Slack投稿まで一気通貫で処理できます。
App Store でダウンロード
WhisperDirectはアプリ内で課金しません。OpenAI APIへ直接支払う仕組みなので、中間マージンなしで最安値の文字起こしが実現します。
約¥0.9/分
Whisper APIは約$0.006/分。1ドル150円換算で約¥0.9/分。1時間の録音でも約¥54円前後で処理できます。
例:¥500で約9.3時間分の文字起こしが可能です
数円〜数十円/回
GPT-5 nano / GPT-5 mini / GPT-4.1 nano / GPT-4.1 mini から選択可能。数千文字の要約・議事録作成も低コストで実行。
モデルの提供状況により更新される場合があります
セットアップから文字起こし完了まで、数分で始められます。
音声収集から文字起こし、要約・議事録の作成、外部サービスへの連携まで、会議後のワークフローをまとめて効率化します。
マイクボタンでリアルタイム録音、共有シートからの音声ファイル読み込み、動画ファイルからの音声抽出・圧縮に対応。mp3, m4a, aac, wav, flac, ogg, opus, wma, amr, mpga, webm, aiff, caf、動画はmp4, mov, m4v, webm, mkv, avi, mpeg, mpgに対応します。
文字起こし結果・要約・議事録を自動でSlackの指定チャンネルへ投稿。Google Driveへの自動バックアップにも対応。会議が終わったら、議事録が自動的にチームへ届きます。
音声再生の現在位置に合わせてテキストが自動ハイライト。聞き直したい箇所へのジャンプも簡単。タイムマーカーは5秒刻みで設定可能で、長時間の録音でも素早く目的の箇所を見つけられます。
複数画像を一括処理できる高精度OCRで、ホワイトボードや資料の写真からもテキストを抽出。端末内で処理するためAPI費用は一切かかりません。
要約・議事録生成で使うプロンプトを設定画面から自由に編集可能。「アクションアイテムのみ抽出」「箇条書き形式で出力」など、チームや用途に合わせてAIのアウトプットを最適化できます。
音声ファイル、テキスト、要約、議事録の書き出しに加え、VTT/SRT形式の字幕ファイル生成にも対応。動画コンテンツへの字幕付けや、外部ツールへのデータ連携もスムーズです。
音声の長さと文字数に基づく推定コストをリアルタイムで表示。使い過ぎを防ぐための予算感覚を常に把握しながら利用できます。
LLMモデルの選択、タイムライン間隔の調整(5秒刻みで変更可)、プロンプトの編集など、設定画面で用途に合わせた細かなカスタマイズが可能です。
🏢
会議を録音しておき、終了後すぐにAI議事録を生成。Slackへ自動投稿することで議事録作成の工数をゼロに近づけます。
🎤
長時間のインタビュー音声も高精度に文字起こし。タイムマーカーで発言箇所を素早く参照できます。
🎓
講義録音から要点を自動抽出。学習ノートや復習資料の作成を大幅に効率化します。
🎬
動画ファイルを読み込んでVTT/SRT形式の字幕ファイルを生成。YouTube・動画編集ソフトにそのまま活用できます。
音声:mp3, m4a, aac, wav, flac, ogg, opus, wma, amr, mpga, webm, aiff, caf
動画:mp4, mov, m4v, webm, mkv, avi, mpeg, mpg