Contexted CS自動化 Coco 現状Overview

更新: 2026-06-13 09:00 JST（一本道化・立て直し当日版）。動いているもの・止めたもの・直したものを全部この1枚で見られます。

今日（6/13）の3行まとめ ①「OKしても返信されない」の原因を特定し4箇所修正。LINE経路は実機で送信成功まで確認済み。 ②賢くする仕組み（RAG学習・Miru）は無傷で維持。分析だけのメタ機能（COSIP・guest_eval等）は停止して部品を削減。 ③「無言で壊れる」を廃止 — 受信があるのにCocoが動かない／OK処理の裏エラーを5分毎に自動検知してLINE警報。

1. 本線（一本道）— この5ステップだけがゲスト返信に必須

① 受信メール・LINE・BEDS24ゲストからの連絡を受け取る。

② Coco返信案作成過去の対応事例（RAG）を参照して返信案を作る。

③ 承認LINE承認グループカードが出る。人がOK / 書き直しを判断。

④ 送信Send Hubゲストへ送る唯一の出口。LINE・メール・BEDS24。

⑤ 学習Notion / RAG記録→埋め込み→次回の返信案が賢くなる。

実機検証（6/13）: LINE DM経路は「テスト:」送信 → RAG下書き → 承認カード → OK → 本人到達まで全通過を確認。メール経路は下書き→カード生成まで確認済み、OK→送信は内部テストカードで検証中。

2. ✅ 稼働中 — 本線

稼働中LINE受付係line-dm-proxy.service。ゲストDMと承認グループ操作を受ける。毎朝5時に自動再起動。

稼働中メール見張り係email-monitor.service。OTA/直接メールをIMAPで監視。切断時は30秒で自動再接続。

稼働中BEDS24受付係beds24-webhook.service。Booking/Airbnbの通知を受ける。

稼働中Coco本体openclaw-gateway.service。頭脳: gpt-5.4-mini（主）/ Claude Sonnet 4.6（控え）。

稼働中送信係（唯一の出口）send_hub。承認後にゲストへ送る。深夜分はsend-schedulerが朝まで保留。

稼働中誤送信の物理ガードline-outbound-filter.service。Cocoが承認なしでゲストへ直接送れないようにする。

3. ✅ 稼働中 — 学習・RAG（Cocoを賢くする仕組み・全部維持）

稼働中対応履歴の記録庫case_memory（Notion DB1）。全ゲスト対応を記録。

稼働中意味検索（埋め込み）Voyage AI。過去事例を「意味」で探せるようにする。

稼働中ケース自動クローズcase-auto-close.timer（6時間毎）。閉じたケースが学習に回る。

稼働中運営知識の検索キャッシュops-vector-reconcile.timer（毎日3:30）。業者・スタッフ記録（DB2）。

稼働中Miru（自動改善）reflection-agent.timer（毎朝6:00）。スタッフの書き直しからルールを自動更新。

4. ✅ 監視 — 「無言で壊れる」の再発防止（6/13強化）

仕組み	何を見ているか	状態
`health_check`（5分毎）	Coco本体・メール監視・Notion・Voyageの生存確認 → 異常時LINE警報	稼働中
└ Coco疎通チェック	「ゲスト受信があるのにCocoが一切動いていない」を検知	🆕 6/13追加
└ 隠れエラーチェック	OK処理の裏側エラー（今回の無言死の温床）を検知	🆕 6/13追加
`health-doctor`（毎時）	自己診断・自己治癒	稼働中

5. ⏸ 6/13に止めたもの（分析メタ層 — 返信品質に直接関係なし）

部品	役割だったもの	止めた理由
COSIP（sentinel / aggregator / weekly）	稼働状況の観測・集計・週報	部品が多いほど壊れる。観測はhealth_checkに集約
guest_eval_daily	返信をLLMが毎朝採点（DB4）	採点事故の前歴あり。本線の安定が先
miru-weekly-trend	DB4スコアの週次トレンド検知	guest_eval停止でデータが来なくなるため（日次Miruは稼働継続）
event-bus-consumer	旧・受信の中継係	6/2から停止していたが、実は誰も使っていない遺物だった

止めたものは設定を消していないため、必要になれば systemctl enable --now 〈名前〉.timer で復活できます。

6. 🔧 6/13に直したバグ（4件）

#	症状	修正
1	OK処理が内部エラーでクラッシュ → 送信されない	安全な値変換に修正
2	送信後に記録されずRAGが学習しないケースがあった	記録が無ければ作って閉じる方式に
3	「承認→送信」の正当な状態変化をシステムが拒否	実運用に合わせて許可リストを拡大
4	エラーが誰も見ないファイルに溜まるだけだった	health_checkが検知してLINE警報

7. 既知の課題（次にやること）

🔴 最優先: 6/10〜6/13の停止期間中のLINE着信約19件。実ゲストの未返信がないか、LINE公式アカウントの手動確認をお願いします。

優先	課題	内容
🟡 中	メール経路のOK→送信実機確認	内部テストカード（「内部E2Eテスト0613」）のOK確認待ち
🟡 中	debouncer層の撤去（段階2）	OK→送信の間に残る複雑な中継部品。動作はするが将来の故障源。落ち着いて撤去予定
🟢 低	ローカル⇄VPSのコード乖離	過去の事故原因。6/13からVPS→ローカル同期を再開済み

8. 障害が起きたらまず見る場所

順番	確認すること
1	LINE警報が来ていないか（health_checkが5分毎に監視中）
2	VPSで `systemctl list-timers` — 本線タイマーが動いているか
3	`logs/send_hub.jsonl` の末尾 — 最後に送信できた時刻
4	`/tmp/ops_chat_logger_stderr.log` — OK処理の裏側エラー

設計原則（2026-06-13版）: 受信1つ・判断1つ・承認1つ・送信1つ・学習1つ。部品を足す前に「壊れたら誰が気づくか」を必ず決める。新部品は「テスト:」のE2Eで実機検証してから本番へ。VPSが正、修正後は必ずローカルへ同期。

Contexted CS自動化プロジェクト / 最終更新 2026-06-13 09:00 JST