「変な友達がパソコンに住んでいる」
Peter Steinberger という人物は、Apple開発者コミュニティでは説明不要の存在だ。iOS/macOSエコシステムで20年のキャリアを持ち、一度は引退したベテランエンジニア。そのSteinbergerが Peter Yang のYouTubeチャンネルで40分にわたって語ったのは、自作ツールOpenClawを介してAIエージェントを「生活のOS」にしてしまった実験の全貌だった。
OpenClawは、AnthropicのClaude CodeをWhatsApp・Telegram・Discord・iMessage等のメッセージングプラットフォームに接続するオープンソースプロジェクトである。TypeScript 30万行超。「最初は1時間で書いたWhatsApp→Claude Code連携が、勝手に育った」とSteinberger自身が振り返る。
モロッコの旅先からバグを直す ― AIが「勝手に」解決した瞬間
象徴的なエピソードがある。モロッコの友人の誕生日旅行中、TwitterでバグレポートのツイートがSteinbergerに届いた。彼はスクリーンショットを撮り、WhatsAppに貼っただけだ。AIはツイートを読み、バグを特定し、Gitリポジトリをチェックアウトし、修正してコミットし、Twitter上で報告者に「直った」と返信した。Steinberger本人はモロッコの街を歩いていた。
さらに驚くべきは音声メッセージの件だ。音声対応を実装していないのに、Steinbergerがボイスメッセージを送ったところ、AIはファイルヘッダを解析して音声フォーマットを特定し、ffmpegを見つけて変換し、OpenAI APIのWhisperで文字起こしして返答した。「全部勝手にやった。どうやったんだ?と聞いたら、手順を淡々と説明された」。Steinbergerが「unshackled ChatGPT」と表現する理由がここにある。コンピュータへのフルアクセスを持つAIは、明示的に教えていないタスクでも「道具を見つけて組み合わせる」ことができる。
フライトチェックインからベッドの温度まで ― 80%のアプリが消える世界
Steinbergerの現在の生活は、ほぼすべてがAIアシスタント経由で回っている。フィリップスHueで照明を制御し、Sonosで音楽をかけ、Eight Sleepのリバースエンジニアリング済みAPIでベッドの温度を調整する。セキュリティカメラを監視させたら、一晩中ソファの影を「不審者」と誤認してスクリーンショットを撮り続けていたという笑い話もある。British Airwaysのフライトチェックインでは、AIがDropbox上のパスポートを自力で探し当て、情報を抽出し、CAPTCHA(「私は人間です」)ボタンを含めてブラウザ操作を完遂した。
「MyFitnessPalで食事を記録する必要がどこにあるのか」とSteinbergerは問う。「AIはもう、私がケンタッキーフライドチチキンにいることを知っている。写真を送れば勝手にカロリーを計算して、ジムに行けと煽ってくる」。フィットネスアプリ、ToDoアプリ、ショッピングアプリ、フライト管理アプリ ― APIを持つサービスはすべて、AIアシスタントの「スキル」に吸収される。「スマートフォンのアプリの80%は消えるだろう」と彼は断言した。
「slop town」― 味覚なき大規模オーケストレーションへの痛烈な批判
筆者がこのインタビューで最も注目したのは、Steinbergerの開発思想に関するパートだ。彼はAIエージェントのマルチオーケストレーション、つまり数十のエージェントを同時に走らせて「市長(mayor)」や「監視者(watcher)」を置く構成を「slop town」と呼んで一刀両断する。名指しされたGastown(マルチエージェントフレームワーク)については「非常に洗練されているが、非常に壊れている」と容赦がない。
同様に、AIを24時間ループさせて「何時間動いた」と誇るトレンドを「vanity metric(虚栄の指標)」と切り捨てた。「私も26時間ループを回して得意になったことがある。でも意味がなかった」。
核心はこうだ ― 「エージェントは確かにspiky smart(ピーキーに賢い)だが、tasteを持っていない。人間がループに入らなければ、何を作ってもslopになる」。プロジェクトの冒頭に完全なスペックを書いてAIに丸投げする手法を彼は否定する。「最初はぼんやりとしたアイデアがあって、作りながら触りながら感じながらビジョンが明確になっていく。次のプロンプトは、今の状態を見て感じて考えた結果で決まる。感情がループに入っていなければ、良いものは生まれない」。
MCPは使わない、plan modeは要らない、worktreeも不要
開発スタイルにおけるSteinbergerのhot takesは刺激的だ。
- MCP(Model Context Protocol)は使わない ― 「あの類のものは使わない (I don't use MCPs or any of that crap)」。大規模オーケストレーションシステムを信じていない。人間がループにいれば、製品の感触がよくなる。速度はもう十分速い。
- plan modeは不要 ― 「plan modeは、モデルがtrigger-happyで勝手にコードを書き始めるからAnthropicが仕方なく追加したハックだ」。最新モデル(GPT-5.2等)では、自然に会話するだけでいい。
- worktreeも不要 ― 代わりにリポジトリを複数チェックアウトし(cloudbot 1, 2, 3, 4, 5...)、分割ターミナルで並列に走らせる。「RTSゲームのように部隊を管理する感覚」。1つだけだと待ち時間が長すぎてゾーンに入れない。複数並列が最適解。
筆者はこの一連の主張を、ベテランの経験主義として概ね正当に受け止める。Steinbergerが否定しているのはツール自体ではなく、「ツールを積み上げること自体が目的化する罠」― 彼が言う「agentic trap」だ。エージェントが凄いと感じた瞬間に、もっと凄いワークフローを組みたくなる。だがそこで2ヶ月を費やしても、プロダクトは1行も前に進まない。
PRはprompt request ― 非エンジニアが開発に参加する時代
もう一つ見逃せないのは、Steinbergerの元ビジネスパートナー(弁護士出身)がOpenClawにプルリクエストを送るようになったという話だ。Steinbergerはこれを「PRはpull requestではなくprompt request」と表現する。コードの品質は問わない。意図(intent)が伝われば十分で、実装は自分がAIを使って書き直す。非技術者がソフトウェア開発に「意思決定者」として参加できる ― これはAIコーディングの民主化の一側面だが、同時に「システムレベルの理解がなければ最適な出力にはならない」という限界も含意している。
筆者はこう読む ― 「味覚」は自動化できない
Steinbergerのインタビューから抽出すべきメッセージは、実は非常にシンプルだ。AIコーディングの本質は「何でも作れること」ではなく、「何を作るべきか」を判断する人間の taste にある。24時間ループもマルチエージェントも、それ自体は技術的に面白い。だが味覚なき自動化は、規模が大きくなるほどslopの山を積むだけだ。
同時に、「変な友達がパソコンに住んでいる」という彼の表現は、AIエージェントの本質を最も正確に言い当てている。それは「ツール」ではなく「同居人」だ。同居人には全幅の信頼を置けないが、生活を劇的に楽にしてくれる。80%のアプリが消えるかどうかはまだ分からない。だが「単機能アプリ」が「文脈を持つ汎用アシスタント」に吸収される流れは、もう後戻りしないだろう。味覚を持った人間と、文脈を持ったAI。その組み合わせが、次の10年のソフトウェアを形作る ― Steinbergerの40分は、そのことを身体で示していた。




