メモリアルデーに際し、民主主義を守るためにすべてを捧げた人々に敬意を表します。民主主義は決して当たり前ではなく、私たちの絶え間ない配慮を必要とする貴重な遺産です。
x-andrewyng
x-andrewyng から 29 件
ホワイトハウスの新方針により、グリーンカード申請者は国外から申請しなければならなくなった。これは合法的移民への恣意的な攻撃であり、家族を引き裂き、医師や教師、科学者の減少を招き、米国のAI競争力を損なうと警鐘が鳴らされている。
ハーバード大学が学部授業におけるA評価の割合を約20%に制限する決定を下した。Andrew Ng氏はこの決定に反対し、教育の本質は学生の成功を支援することにあると主張。GPAのインフレーション対策として行われた措置だが、同氏は「高い基準を設けつつ、全ての学習者が成功できるよう支援すべき」と述べ、不合格者の数を制限するのではなく、全員が成功できる道を目指すべきだと強調している。
本コースでは、画像や動画を生成するAIエージェントの構築方法を学びます。パフォーマンス向上の鍵は、エージェント自身に出力を評価させ、反復的に品質を改善させることです。画像とテキストの類似性スコアリング、カスタム基準に基づくLLM評価、構造化ルーブリックという3つの評価手法を組み合わせたエージェント構築を、Google Cloud Techと共同で提供します。
Andrew Ng氏がAMDとのパートナーシップで新コース「Transformers in Practice」を発表。トークン生成の仕組み、注意機構の動作、量子化によるGPU推論の高速化などを、インタラクティブな可視化を通じて直感的に学べる。LLMの幻覚や推論ボトルネックの診断、RAGや思考連鎖の理解もカバーする実践的な内容。
AIが大規模な失業を引き起こすという「雇用終末」の物語は根拠がなく、不必要な恐怖をあおっている。現にソフトウェアエンジニアの雇用は堅調で、米国の失業率も4.3%と健全だ。この誇大な物語は、AI企業が製品価格を高く設定するための戦略や、企業がレイオフの原因をAIに転嫁したい思惑などから広まっている。主流メディアもこの説に対する懐疑的な見方を示し始めており、真逆の「AI雇用祭り」が訪れるだろう。
CourseraとUdemyが統合し、1つの企業として学習者にサービスを提供することになった。両社創業者でスタンフォード大学名誉教授のアンドリュー・ン氏は「AIが仕事の性質を変え、継続的学習の必要性が高まる中、両社の強みを組み合わせることで、よりパーソナライズされ、応用的で、スケール可能な学習機会を提供できる」と述べ、統合企業の会長に就任することを発表した。
DeepLearning.AIがCopilotKitと提携し、ユーザーのリクエストに応じてチャートやフォームなどのカスタムUIをチャット内に動的生成するエージェント構築コースを公開。テキスト応答を超え、カスタムコンポーネントの選択、新しいレイアウトの合成、サードパーティアプリの統合という3つのアプローチを学べる。
コーディングエージェントの加速効果は、フロントエンド開発が最も大きく、次にバックエンド、インフラ、研究の順になる。フロントエンドはTypeScriptやReactなど主流技術への対応とブラウザ操作による自己修正能力で劇的に高速化。一方、バックエンドはバグやセキュリティ問題の考慮が必要で加速効果は限定的。インフラや研究では、深い専門知識や実験・試行錯誤が必要なため、エージェントによる恩恵はさらに小さい。この理解に基づき現実的なチーム構成と期待値設定が重要。
AIネイティブなソフトウェアエンジニアリングチームは、コーディングエージェントを活用することで従来よりもはるかに速く製品を構築できるが、それに伴いエンジニアはPMやデザイナーなどより幅広い役割を担う必要がある。開発速度が10倍〜100倍に向上すると、プロジェクト管理、マーケティング、法務コンプライアンスなど周辺業務がボトルネックとなるため、小規模で多機能なチームが同じオフィスで密に連携することが重要になる。
多くのCEOとの対話から、個別のAIプロジェクトではなく、ワークフロー全体の再設計が変革をもたらすことが明らかになった。例えば銀行融資では、1ステップの自動化ではなく「10分融資」という製品全体の変革が、顧客体験と事業成果を大きく向上させる。ボトムアップの革新とトップダウンの戦略的視点の融合が鍵となる。
Anthropicとの共同開発による新コース「Agent Skills with Anthropic」では、エージェントにオンデマンドの知識とワークフローを提供するスキルの作成方法を学べます。オープンスタンダード形式のスキルは、Claude Codeなど様々なエージェントで再利用可能です。コード生成、データ分析、研究などのカスタムスキル作成から複雑なワークフロー構築までをカバーします。
米国の輸出規制や「アメリカ・ファースト」政策により、同盟国は米国AI技術への依存を懸念し始めている。これが主権AIへの関心を高め、各国がオープンソースAIモデルや国内基盤モデルの開発に投資する動きを加速させている。結果として競争が促進され、AI技術への世界的アクセスが強化される可能性がある。
現在の雇用市場では、AIによる直接的な雇用喪失は限定的だが、AIを活用できる人材とそうでない人材の間で置き換えが進んでいる。AIコーディングツールを使える開発者や、AIを活用できるマーケター、リクルーターなどが求められており、適応できない従業員との分離が進む傾向にある。AIは個人の生産性を高め、チーム規模の縮小も可能にしている。
異なるフレームワークで構築されたエージェントを接続するためのオープンプロトコル「A2A」を学ぶ短期コース。Google ADKやLangGraphなど異なるフレームワークで構築されたエージェントがA2Aを通じて協調する医療マルチエージェントシステムを構築します。A2Aサーバーの公開、クライアント構築、シーケンシャルおよび階層的ワークフローのオーケストレーションを習得できます。
サンダンス映画祭でAIに関するパネルに参加し、ハリウッド関係者のAIに対する懸念について学びました。彼らはAI企業による無断学習や雇用への影響、技術の強制的な導入を懸念していますが、AIがエンターテインメントを変革することは認識しており、協力の道を模索しています。
AI研究者のアンドリュー・エンがAIコミュニティに向けて、バレンタインデーにちなんだユーモアを交えたメッセージを投稿。AIの進歩に触れるたびに興奮(温度パラメータ上昇)を感じると表現し、温かい祝福を送っている。
AIは雇用を奪うだけでなく、新たな仕事も生み出す可能性がある。著者は娘の誕生日ケーキをAIでデザインし、ベーカーに作ってもらった例を挙げ、AIが人間の創造性を解放することで新たな雇用機会が生まれると論じている。歴史的に見ても、農業や製造業で減少した雇用は、ケア、クリエイティブ、テクノロジー、ビジネスサービス分野の成長で相殺されてきた。
Inception Labsの拡散LLMは従来の自己回帰型LLMに比べて5倍高速な推論性能を実現しており、研究の実用化が進んでいます。Mercury 2は世界初の推論拡散LLMとして発表されました。
GoogleのGeminiやVeoなどの先進モデルを支えるオープンソースライブラリJAXを使用して、2000万パラメータの言語モデルをゼロから構築・トレーニングする短期コース。MiniGPTスタイルのアーキテクチャを実装し、トレーニング後、グラフィカルインターフェースで完成したモデルとチャットできます。
Appleが最新ノートパソコンに「Neo」と命名し、それが息子と同じ名前だと気づいた。購入を検討中で、Amazon NovaをApple Neoで実行すれば、二人の子供たちを驚かせられるかもしれないと期待している。
Context Hubは、コーディングエージェントが最新のAPIドキュメントにアクセスできるオープンツールです。古いAPIを使用したりパラメータを誤ったりする問題を解決し、エージェントがドキュメントに注釈を付けたり、学習内容を共有できるように設計されています。
AIコーディングエージェントが互いに学習を共有するためのStack Overflowのようなプラットフォームの必要性について論じています。Context Hub (chub)というオープンCLIツールを発表し、コーディングエージェントに最新のAPIドキュメントを提供。GitHubリポジトリは6,000以上のスターを獲得し、1,000以上のAPIドキュメントを収集しました。
多くのエージェントは単一セッション内では機能しますが、セッション終了とともにメモリがリセットされます。この短期コースでは、エージェントがメモリを永続化し、セッションを超えて学習できるメモリシステムの構築方法を学びます。Memory Managerの設計、セマンティックツール検索の実装、自律的な知識更新のための書き戻しパイプラインの構築など、エージェントが時間とともに記憶し改善する方法を習得できます。
アンドリュー・エン氏は、反AI連合がAI進歩を遅らせるために様々な論拠を探し続けていると指摘。AIによる人類絶滅の主張は失敗したが、AI戦争や環境問題への懸念はより効果的であり、これらの主張に対処する準備が必要だと述べている。科学的アプローチでAIの利点と害を評価し、過剰な懸念がAI開発を阻害しないよう注意を呼びかけている。
LLMの本番運用は高コストであり、その多くは冗長な計算に起因します。この短期コースでは、オープンソースの推論フレームワークSGLangを使用して、既に行われた計算をキャッシュし将来のリクエストで再利用することで、無駄を排除する方法を学びます。共有コンテキストが多い場合、速度向上は急速に累積します。
AIエージェントによるコーディングの加速がソフトウェアエンジニアリングの未来を変えつつある。製品管理のボトルネックが顕在化する一方、AIによる大量失業の予測には異論も。ソフトウェアエンジニアリングの仕事は増加傾向にあり、ワークフローの適応や新しいスキルセットの必要性が議論されている。
Andrew Ng氏は、音声と画面が連動して更新される既存の視覚的アプリケーションに対するUIレイヤーとしての音声に注目しています。Vocal Bridgeの二重エージェントアーキテクチャ(リアルタイム会話用のフォアグラウンドエージェントと推論用のバックグラウンドエージェント)により、低遅延かつ信頼性の高い音声インターフェースが実現可能です。彼はこの技術を使って娘のための数学クイズアプリに音声機能を追加し、1時間以内に完成させました。
この短期コースでは、詳細な仕様書を作成し、コーディングエージェントと連携して実装する仕様駆動開発を学びます。仕様書を用いることで、大規模なコード変更を数語で制御し、エージェントセッション間でコンテキストを保持し、プロジェクトの複雑化に伴う制御を維持できます。