TAG · #AI-RESEARCH

#ai-research

23 件

HOTNESS

RoboLab: ロボットおよびポリシーに依存しないシミュレーション・ベンチマーキング
3.5
RoboLabは、さまざまなロボットプラットフォームと制御ポリシーに対して公平な評価を可能にする、ロボットおよびポリシーに依存しないシミュレーション・ベンチマーキング環境です。これにより、異なるロボット設計や学習アルゴリズムの性能を一貫した方法で比較・評価することができます。
hn2026年4月22日#テクノロジー
Sam 2: Segment Anything in Images and Videos
2.5
Sam 2は、画像と動画の両方で任意のオブジェクトをセグメンテーションできる次世代モデルです。前身のSegment Anythingモデルを拡張し、より高速で正確なセグメンテーションを実現し、動画における時間的一貫性も考慮しています。
hn2026年4月22日#テクノロジー
Messy paper streams in. Structured research feeds out
3.0
Paperzilla transforms messy academic paper streams into structured, organized research feeds. By converting scattered scholar alerts and raw publication data into clean, actionable briefs, the platform helps researchers stay on top of the latest literature without information overload. This shift from passive alerts to intelligent agent-driven summaries represents a new paradigm in research discovery.
hn2026年4月22日#テクノロジー
Google Gemini Deep Research Agents Now Search Both Web and Private Data via MCP
7.5
Googleは、複雑な研究タスクを自動化するDeep ResearchおよびDeep Research Maxエージェントを発表しました。これらのエージェントは、MCP（Model Context Protocol）を介してウェブとプライベートデータの両方を検索し、包括的な調査分析を可能にします。
hn2026年4月22日#テクノロジー
NeurIPS、著者をGoogleの論文アシスタントツール（Pat）でサポート
3.5
NeurIPSは、Googleの論文アシスタントツール（Pat）を著者に提供し、論文執筆プロセスを支援します。このツールは、研究の質を維持しながら、著者がより効率的に論文を執筆できるよう設計されています。
hn2026年4月22日#テクノロジー
Deep Research Max: 自律的研究エージェントの飛躍的進化
7.5
Deep Research Maxは、Googleの次世代Geminiモデルを活用した自律的研究エージェントで、複雑な研究タスクを理解し、計画を立て、実行する能力を大幅に向上させます。これにより、研究者はより深い洞察と効率的な分析が可能になります。
hn2026年4月21日#テクノロジー
AIによるFRB研究、9.2σで2つの放射領域を発見。ApJはこれを停止
7.5
AIを活用した高速電波バースト（FRB）の研究で、統計的有意性9.2σで2つの異なる放射領域が検出された。しかし、この画期的な発見を掲載予定だったAstrophysical Journal（ApJ）は論文の出版を停止した。
hn2026年4月21日#サイエンス
Show HN: Paper Lantern – 研究知識でAutoresearchを改善
3.5
Paper Lanternは、200万以上のコンピュータサイエンス研究論文を検索するMCPサーバーで、コーディングエージェントが問題を記述すると、実装手順、ハイパーパラメータ、失敗モードを含むランク付けされた技術を返します。Autoresearchフレームワークでのテストでは、Paper Lanternを組み込んだエージェントがより優れたLLMアーキテクチャとトレーニング設定を見つけ、バリデーション損失を3.2%低減させることに成功しました。
hn2026年4月21日#テクノロジー
LLMは英語以外でどの程度機能するのか？ 8言語で8つのモデルをテストしました [pdf]
3.5
RWSの研究では、英語以外の言語における大規模言語モデル（LLM）の性能を評価するため、8つの主要なLLMを8つの言語でテストしました。この研究では、多言語環境におけるLLMの限界と可能性を明らかにし、多言語AIの開発における重要な洞察を提供しています。
hn2026年4月21日#テクノロジー
LeWorldModel: ピクセルからの安定したエンドツーエンドJEPA
6.0
LeWorldModelは、ピクセル入力を直接使用して安定したエンドツーエンドのJEPA（Joint Embedding Predictive Architecture）を実現するモデルです。このアプローチは、視覚表現学習と予測的アーキテクチャを統合し、効率的な世界モデルの構築を目指しています。
hn2026年4月20日#テクノロジー
Agentic Context Engineering: 自己改善する言語モデルのためのコンテキスト進化
6.5
Agentic Context Engineeringは、言語モデルが自らのコンテキストを進化的に最適化することで、継続的な自己改善を実現する新しいアプローチです。この手法により、モデルは反復的なプロンプトエンジニアリングを自動化し、タスク性能を向上させることができます。
hn2026年4月20日#テクノロジー
AI研究者が語るAI研究開発の自動化と知能爆発に関する見解
7.5
本論文では、AI研究者を対象とした調査を通じて、AI研究開発の自動化と知能爆発に関する見解を分析。研究者の多くはAI R&Dの自動化が進むと予測する一方、知能爆発の可能性については意見が分かれている。技術的進歩と社会的影響の両面から議論を展開。
hn2026年4月20日#テクノロジー
RL Scaling Laws for LLMs
4.5
大規模言語モデルにおける強化学習のスケーリング則について、モデルサイズ、データ量、計算リソースの増加に伴う性能向上の関係性を分析します。効率的なRLHF（人間によるフィードバックを用いた強化学習）の実装に向けた重要な知見を提供します。
hn2026年4月20日#テクノロジー
LLM from scratch (32l) – Interventions: 更新された指示ファインチューニング結果
2.5
32層LLMのスクラッチ構築プロジェクトにおいて、指示ファインチューニングの結果を更新。介入手法の効果を検証し、モデルの性能向上を実証した最新の実験結果を報告。
hn2026年4月21日#テクノロジー
Vibe physics: The AI grad student
3.0
Anthropicの研究チームは、物理シミュレーションを学習するAIシステム「Vibe physics」を開発しました。このAIは、物体の動きや相互作用を直感的に理解し、現実世界の物理法則を捉える能力を示しています。
hn2026年4月20日#テクノロジー
Codex Chronicle (研究プレビュー)
2.0
OpenAIのCodex Chronicleは研究プレビューとして公開されており、AIモデルの開発と進化に関する洞察を提供しています。このリソースは、Codexの能力とその応用可能性についての最新情報を開発者に提供することを目的としています。
hn2026年4月20日#テクノロジー
RT Anthony Pompliano 🌪: 明日ウェビナーを開催し、エージェント型研究製品の仕組みを説明し、システムが先週特定した様々な洞察について議論します
0.5
アンソニー・ポンプリアーノは明日、エージェント型研究製品の機能説明と、システムが先週特定した洞察について議論するウェビナーを開催します。投資家やAI開発者にとって興味深い対話となる予定です。
x-apompliano2026年4月20日#テクノロジー
明日、エージェント型リサーチ製品の仕組みを説明するウェビナーを開催します
1.0
明日開催するウェビナーでは、エージェント型リサーチ製品の仕組みを説明し、過去1週間にシステムが特定した様々な洞察について議論します。投資家やAI開発者にとって非常に興味深い対話となるでしょう。
x-apompliano2026年4月20日#テクノロジー
速報：サム・アルトマン、AGI達成には単なるスケーリングを超えた大きなブレークスルーが必要と認める
4.0
OpenAIのCEOサム・アルトマンは、真の人工知能（AGI）を実現するためには、現在の大規模言語モデルの単なるスケーリングを超えた、新たなアーキテクチャの大きなブレークスルーが必要であることを認めました。これはAI研究の方向性に関する重要な認識の転換を示しています。
garymarcus-substack-com2026年3月16日#テクノロジー
Anthropicの（おそらく）恐ろしい新報告「Mythos」から何を学ぶべきか？
2.0
Anthropicが公開した「Mythos」報告書は、AIの潜在的なリスクについて警鐘を鳴らしている。具体的な事実は限られているが、この報告を冷静に分析し、AI開発における安全性と倫理的配慮の重要性について考える出発点として捉える必要がある。
garymarcus-substack-com2026年4月8日#テクノロジー
神経記号AIの未来に関するさらなる朗報
3.0
Appleの2025年の推論論文に対する不当な批判への反論と、神経記号AIの将来に対するさらなる前向きな見通しについて。
garymarcus-substack-com2026年4月12日#テクノロジー
RLはあなたが思っている以上に情報効率が悪い
4.0
強化学習（RL）は従来考えられていた以上に情報効率が低く、RLVR（強化学習によるビデオ生成）の進展にも影響を及ぼす可能性がある。
dwarkesh-com2025年11月17日#テクノロジー
Inception Labsの拡散LLMによる印象的な推論速度。拡散LLMは従来の自己回帰型LLMの魅力的な代替手段です。
4.0
Inception Labsの拡散LLMは従来の自己回帰型LLMに比べて5倍高速な推論性能を実現しており、研究の実用化が進んでいます。Mercury 2は世界初の推論拡散LLMとして発表されました。
x-andrewyng2026年2月25日#テクノロジー

次の 30 件を読み込む最終更新 —