海外ユーザーが1週間のデスクトップ制御実験を敢行
XDA Developersのライターが、Claude Codeに1週間デスクトップの制御権を渡してみたという体験記が話題になってる。最初のテストはシンプルで、「Windowsの電卓を開いて1234×5678を計算して、結果をメモ帳にコピペしてresult.txtでデスクトップに保存して」って指示しただけ😊
結果?完璧に動いたんだって。セットアップ(Gitのインストールとコンピューター使用許可)さえ済ませれば、あとは自然言語で指示するだけ。電卓を開く→計算する→結果をコピー→メモ帳に貼り付け→ファイル保存という一連の流れを、Claude Codeが勝手にやってくれた。
「これはスゴいことになったぞ」って確信した瞬間だったらしい。プログラミングだけじゃなく、普通のデスクトップ作業も自動化できるって気づいたから。実際にこの機能を使って、毎日のレポート作成を自動化したり、複数のアプリを連携させた定期処理を組んだりと、実用性はめちゃくちゃ高い。
特に印象的だったのが、エラーハンドリングの賢さ。途中でアプリが応答しなくなったときも、Claude Code側で「ちょっと待ってから再試行してみますね」って勝手に判断して続行してくれたんだって。人間だったらイライラして諦めちゃうようなシチュエーションでも、淡々と処理を完了させる姿勢がある意味恐ろしい。
スマホからサーバーを起動する未来がもう来てた
一番気に入ったのがDispatch機能っていう、スマホからPCに指示を送る仕組み。外出先から「サーバーを起動して」「PCの状態をチェックして」「ファイルをクラウドにアップしてスマホで見れるようにして」みたいな指示を送ると、Claude CodeがPC側でタスクを実行して結果を報告してくれる📊
これ、リモートワーカーには革命的だよね。家のPCで何か処理をさせたいとき、わざわざリモートデスクトップを立ち上げなくても、LINEを送る感覚で指示できちゃう。しかも報告メッセージも自然言語で「サーバー起動完了しました。現在のCPU使用率は12%、メモリ使用量は4.2GBです」みたいに人間らしく教えてくれる。
実験期間中には、出張先のホテルから家のPCでデータベースのバックアップを取らせたり、長時間の動画変換を開始させたりと、かなり実用的に使い倒してたみたい。セキュリティ面も、事前に設定したホワイトリスト以外のアプリには触れないようになってるから、意外と安心して任せられるらしい。
↑実際にClaude Codeでアプリを作ってる様子。コードを一切書かずにWebアプリが完成してる🛠️
このDispatch機能の背景には、Anthropicが開発した独自のマルチエージェント技術がある。簡単に言うと、複数のAIを連携させて一つの大きなタスクを処理する仕組み。1つのAIがスマホでユーザーの指示を受け取り、別のAIがPC側で実際の作業を実行し、さらに別のAIが結果を整理してレポートする、みたいな役割分担をしてる。
Opus 4.7で追加された開発者向け新機能がエグい
4月にリリースされたClaude Opus 4.7では、開発者向けの機能がめちゃくちゃ強化された。注目は「ultrareview」っていうコードレビュー専用機能。普通のレビューじゃ見落としがちなバグや設計上の問題を、めちゃくちゃ詳細にチェックしてくれる💡
ProとMaxプランのユーザーには3回分のultrareviewが無料で付いてくる。さらにMaxユーザー限定で「auto mode」も追加。これは長時間のタスクを実行するとき、いちいち許可を求めずにClaude側で判断して進めてくれる仕組み。
ベンチマークでも結果がハンパない。The Next Webによると、SWE-bench(ソフトウェア工学のテスト)で64.3%、CursorBench(AI開発環境での自動コーディング能力)では70%をマークしてる。前バージョンの58%から一気に12ポイントアップ🚀
ultrareviewの威力を実際に体験した開発者の声を見てみると、「人間のレビュアーが3日かけても見つけられなかったメモリリークを10分で発見してくれた」とか「APIの使い方が非効率だった部分を具体的な改善案とセットで指摘してくれた」といった報告が続々と上がってる。
しかも面白いのが「xhigh」っていう新しいエフォートレベル。通常の処理よりも時間をかけて、より深く考えてくれるモード。複雑なアルゴリズムの最適化や、セキュリティホールの検出なんかで真価を発揮するらしい。ただし処理時間は通常の3-5倍かかるから、本当に重要なプロジェクトでしか使わないほうがいいって開発者たちは言ってる。
Z80アセンブリまで書けちゃった話
Hackadayでは、Claude CodeにZ80アセンブリ言語でWordleゲームを作らせる実験をしてた。Z80って1970年代のレトロなCPU用の言語で、今どき使う人はほとんどいない超ニッチな分野👀
結果的にはちゃんと動くゲームができたんだけど、面白いのはClaude側のアプローチ。「Wordleのゲーム全体を作って」じゃなくて、「まずはキーボード入力を受け取る部分を作って」「次は単語照合の部分を作って」みたいに、ステップバイステップで指示したのが成功の秘訣だったみたい。
この実験が示してるのは、Claude Codeの柔軟性。現代のPythonやJavaScriptみたいなメジャー言語じゃなくて、40年以上前のアーキテクチャでも対応できちゃうってこと。実際にZ80の細かい仕様(レジスタの使い分けとか、メモリ管理の制約とか)もちゃんと理解して、効率的なコードを生成してたんだって。
レトロコンピューターのTEC-1G向けに作られたWordleは、オリジナルのWeb版とほぼ同じルールで動作。5文字の英単語を6回以内に当てるゲームで、正解・不正解の表示もちゃんと実装されてた。Z80の限られたメモリ容量の中で、辞書データの圧縮まで考慮されてるのが職人技。
↑GmailとGoogleカレンダー、Slackを連携した個人アシスタントの作り方。これも自然言語での指示だけで完成してる。
このZ80実験で注目すべきは、Claude Codeが「学習データにないはずの古い技術」でもちゃんと対応できるってこと。おそらく基礎的なコンピューターサイエンスの知識から論理的に推論して、Z80の仕様を理解してるんじゃないかって専門家は分析してる。これって、単なる「覚えた答えを出力するAI」じゃなくて、「理解して応用できるAI」の証拠かもしれない。
デザイン分野にも進出、Claude Designで時間短縮が現実的に
4月には「Claude Design」という新サービスも登場。Inc.comのライターは、これで週10時間の時短に成功したって書いてる。
特にインフォグラフィック制作では劇的な変化があったらしい。今まで1つ作るのに4-6時間かかってたのが、Claude Designなら研究からデザインまで全部込みで1時間程度。週4本のインフォグラフィックを作ってるから、これだけで週12-20時間の短縮効果🎉
プレゼンテーション作りでも威力を発揮。Maven(オンライン教育プラットフォーム)での研修資料を35分で完成させたって報告もある。Gammaみたいな既存ツールと比べて、デザインのクオリティーが段違いに良いらしい。
「プロのデザイナーの代替にはならないけど、スタートポイントとしては十分すぎる出来栄え」っていうのが実際に使った人の感想。CanvaやHTML、Claude Codeへのエクスポートにも対応してるから、さらなるカスタマイズも可能だよ。
Claude Designの背景技術も興味深い。テキストプロンプトからビジュアル要素を生成するとき、単純に「綺麗な図表を作って」じゃなくて、「このデータを見やすく伝えるには何色がいいか」「読み手の注意をどこに向けさせるか」といった、デザイナーが普通に考えることをAI側で自動判断してる。
カラーパレットの選択も賢くて、企業のブランドカラーを指定すると、それに合う補色や中間色を自動で提案してくれる。フォントの組み合わせも、読みやすさと見た目のバランスを考慮して最適化される仕組み。Adobe IllustratorやFigmaで手作業でやってた作業の8割くらいは自動化できちゃう感じ。
↑Claude Codeの便利機能7選。日本のユーザーによる詳細解説で、実用的なtipsが満載🤔
OpenAIも対抗してきた、AI開発ツール戦争が激化
The Vergeによると、OpenAIもCodexのアップデートでデスクトップアプリ操作機能を追加してきた。macOS限定だけど、複数のエージェントを並列動作させたり、バックグラウンドで作業させたりできるようになった。
面白いのは「記憶機能」も搭載予定ってこと。過去のやり取りから個人の好みや修正パターンを学習して、次回から同じような指示をしなくても済むようになるらしい。これはClaude Codeにはまだない機能だから、競争が激しくなりそう。
でも現時点では、Claude Codeの方が一歩リード。年間売上25億ドル(約3750億円)っていう数字が物語ってるように、開発者からの支持は圧倒的だね。Anthropic全体でも年間売上300億ドル規模まで成長してて、IPO(株式上場)の話も出てきてる。
この競争で一番得するのはユーザー。OpenAIが記憶機能を出せば、Anthropicも対抗して同様の機能を追加してくるだろうし、機能の充実スピードがどんどん加速してる。半年前には「夢物語」だった「自然言語でPCを完全操作」が、もう当たり前になりつつある。
業界のアナリストは「2024年末までに、プログラミング経験ゼロの人でも複雑な業務システムを構築できるようになる」って予測してる。実際に非エンジニアの営業マンがClaude Codeで顧客管理システムを自作したとか、経理担当者が請求書処理を完全自動化したとか、そういう事例がもう出始めてる。技術の民主化が本格的に始まった感じがする。



