ホテル・旅館の電話受付は、夜間・休日にスタッフを縛り続ける典型的な業務です。
2025 年までは、AI 音声対話の遅延が大きく実用に耐えませんでした。
2026 年に入って、これが変わりました。
OpenAI の gpt-realtime が、800ms の voice-to-voice 遅延 を実現したのです。
この記事で分かること
- gpt-realtime の標準コスト(2026 年 5 月時点)
- $0.05/分まで下げる 3 つの工夫
- 100 室ホテルの夜間電話で月 29 万円削減の試算
- 緊急通報など「絶対に AI に任せてはいけない」ライン
標準コスト(2026 年 5 月時点)
OpenAI 公式の Realtime API 価格は次の通り。
| 項目 | 価格 |
|---|---|
| Audio Input | $32 / 1M tokens(約 $0.06/分) |
| Audio Output | $64 / 1M tokens(約 $0.24/分) |
| Cached Input | $0.40 / 1M tokens(80×安) |
何も最適化しない場合の典型的な通話コストは:
- $0.18 〜 $0.46 / 分(uncached)
- 1 時間で約 ¥1,500〜4,000
このままでは「夜間スタッフの代わり」としては高すぎます。
$0.05/分まで下げる 3 つの工夫
工夫 01. システムプロンプトを prompt caching で固定する
ホテルの電話受付では、施設情報・FAQ・対応マニュアルを すべての通話で共通の固定プロンプト として使います。
これを毎回送信していると、トークン数が膨らみます。
OpenAI の cached input は $0.40 / 1M(通常の 1/80)。
施設マニュアル 5,000 token をキャッシュしておけば、通話 1 件あたり 数銭の負担 に下がります。
工夫 02. tool 呼び出しの出力を要約して返す
予約確認・在庫照会・チェックイン時刻調整など、AI から PMS API を叩いて結果を音声で返すケースが多くあります。
PMS API が返す JSON をそのまま AI に渡すと、音声化のために大量の output token が消費されます。
API レスポンスをサーバー側で要約してから AI に渡す ことで、音声 output token を半減できます。
工夫 03. 「人にエスカレーション」の境界を厳密に設計する
AI が自信を持って答えられない問い合わせを長々と引っ張ると、output token が膨らみます。
次のいずれかを満たしたら、即座にスタッフへ転送:
- 質問が 3 ターン以内に着地しない
- ゲストが 「人と話したい」と明示した
- 緊急ワード(壊れた、漏れた、痛い、怖い)が出た
AI の役割を明確に区切ることで、コストと品質の両方が安定 します。
Point
「caching + 出力要約 + 境界設計」の 3 点セットで、料金は標準の 1/5〜1/10 まで下がる。
試算: 100 室ホテルの夜間電話受付
前提:
- 夜間 19:00〜翌 9:00 の 14 時間
- 1 日平均 8 件、1 件平均 3 分
- 月間 240 件 × 3 分 = 720 分の通話
最適化なし
$0.30/分 × 720 分 = 月 $216(約 ¥32,400)
最適化あり
$0.07/分 × 720 分 = 月 $50(約 ¥7,500)
夜間スタッフ 1 名分の人件費を月 ¥30 万と仮定すると、月 ¥29 万のコスト削減 になります。
それでも気をつけるべき 3 つのこと
注意 01. 緊急通報は必ず人に流す
火災・救急・犯罪は AI を一切経由させずに人に直結 させる仕組みを別に組みます。
Realtime API の遅延 800ms は、緊急通報では致命的です。
注意 02. 通話録音と保管期間を明示する
- 冒頭で「お電話の内容は AI が処理しています」と必ずアナウンス
- 録音データの保管期間とアクセス権限を明文化
- 利用規約に書き込む
注意 03. 多言語対応の品質を試す
gpt-realtime は多言語に対応していますが、地名・施設名の固有名詞の発音は施設ごとに揺れます。
導入前に、英語・中国語・韓国語で実際にゲストロールをやって品質確認します。
Point
緊急通報・通話告知・固有名詞の発音、この 3 点だけは AI 任せにせず別途設計する。
まとめ
2026 年現在、ホテル電話受付の AI 化は 「できる/できない」の議論ではなく、「どこまで安く運用できるか」の段階 に入っています。
標準価格のまま導入すると月数万円かかりますが、caching・要約・境界設計の 3 点を押さえれば 1 分 $0.05 まで下がります。
ReFlow ができること
ReFlow では、OpenAI Realtime API を使った宿泊事業者向けの電話受付 AI を、導入から運用設計まで一貫してサポートしています。
prompt caching の設計、エスカレーション境界の調整、通話録音の保管設計まで含みます。
