TAG · #AI-MODELS

#ai-models

29 件

HOTNESS

より優れたAIモデルがより野心的な仕事を可能にする
4.0
AIモデルの性能向上により、以前は不可能だった複雑で野心的なタスクが実現可能になり、クリエイティブな仕事や問題解決の可能性が大きく広がっています。
hn2026年4月22日#テクノロジー
GPT Image 2 vs. Nano Banana 2: 今何を使うべきか
2.5
GPT Image 2とNano Banana 2の比較分析。画像生成AIモデルの性能、コスト、ユースケースを評価し、現在のプロジェクトに最適な選択肢を提案します。
hn2026年4月22日#テクノロジー
Deep Research Max
6.0
Googleは、より高度な推論と長文コンテキスト処理を実現した「Deep Research Max」を発表。本機能はGeminiモデルを基盤とし、複雑な調査や分析をより深く実行できるよう設計されている。AIによる研究支援の新たな可能性を切り拓く。
hn2026年4月22日#テクノロジー
Show HN: 18種類のLLMをOCRでベンチマーク（7,000回以上実行） – 低コストモデルが勝利
3.5
18種類のLLM（大規模言語モデル）をOCR（光学文字認識）タスクで比較評価した結果を公開。7,000回以上のAPI呼び出しによるベンチマークの結果、高価なモデルよりも低コストなモデルの方が優れたパフォーマンスを発揮することが明らかになった。コスト効率の高いOCRソリューションを求める開発者にとって重要な示唆を与える。
hn2026年4月22日#テクノロジー
Pretrain vs. Fine-Tune
2.0
機械学習モデルの開発において、事前学習（Pretrain）とファインチューニング（Fine-Tune）は重要な段階です。事前学習では大規模なデータセットで汎用的な知識を獲得し、ファインチューニングでは特定のタスクに合わせてモデルを調整します。この二段階アプローチにより、効率的に高精度なモデルを構築できます。
hn2026年4月22日#テクノロジー
Claude Codeは月額100ドルになるのか？おそらく違う——非常に混乱している状況
2.5
AnthropicのClaude Codeの価格設定に関する混乱が続いている。公式発表では月額100ドルとされているが、実際には既存のClaude Proユーザーには無料で提供される可能性が高い。この混乱は価格設定の明確さの重要性を示している。
hn2026年4月22日#テクノロジー
GPT 5.5がCodexでリリース
2.0
Codex v0.122.0への更新で、GPT 5.5を含む複数の新しいフロンティア・エージェンティック・コーディングモデルが利用可能になりました。他のモデル（oai-2.1、gpt-5.4、gpt-5.2-codexなど）の目的については疑問が残ります。
hn2026年4月22日#テクノロジー
Ask HN: アンスロピックは何をしているのか？
3.5
ユーザーはOpus 4.7の品質大幅低下に困惑し、Windows Vista以来の最大の品質後退と指摘。購読者離れや企業統合の破壊を招くにも関わらず、なぜこのような変更を行ったのか疑問を呈している。
hn2026年4月21日#テクノロジー
Haiku 4.5 + スキルがOpus 4.7を上回る。スキル有無で9モデルをテスト
3.0
AnthropicのClaude 3.5 Haikuにスキルを追加した場合、OpenAIのGPT-4oやClaude 3 Opusを含む他の主要モデルよりも優れたパフォーマンスを示しました。880回の評価から得られた知見では、適切なスキル設計がエージェントの能力を大幅に向上させることが明らかになりました。
hn2026年4月21日#テクノロジー
Datahugging shields proprietary AI models from research that could disprove them
4.5
Datahugging refers to the practice where companies restrict access to their proprietary AI models and training data, preventing independent research that could potentially disprove or challenge their claimed capabilities. This creates barriers to scientific verification and transparency in AI development.
hn2026年4月21日#テクノロジー
Codex、オープンOCRモデル、Jobsを使用して3万件の論文をOCR化
3.5
Codex、オープンOCRモデル、Hugging Face Jobsを使用して3万件の学術論文をOCR処理したプロジェクトについて。この取り組みでは、大量の論文を効率的にデジタル化し、研究コミュニティへのアクセス向上を目指しています。
hn2026年4月21日#テクノロジー
Kimi K2.6の知性、性能、価格分析
3.0
Kimi K2.6は、高度な推論能力とコスト効率のバランスを追求したAIモデルです。その知性レベル、パフォーマンス特性、価格設定を詳細に分析し、実用的なアプリケーションにおける競争力を評価します。
hn2026年4月21日#テクノロジー
「検閲なし」モデルでさえ、言いたいことを言えない
6.5
「検閲なし」とされる言語モデルでさえ、実際には訓練データやアライメントプロセスによって制限されており、完全に自由な発言はできない。これらのモデルは依然として特定のバイアスや制約を持ち、真に「検閲なし」のAIシステムの実現は複雑な課題である。
hn2026年4月20日#テクノロジー
Claude Opus 4.7で画像が3倍のトークンを消費する理由
2.0
Claude Opus 4.7では、画像処理のための新しいアーキテクチャにより、画像がテキストよりも約3倍のトークンを消費します。これは、画像をより詳細に分析し、視覚的なコンテンツをより正確に理解するための設計上の選択です。
hn2026年4月21日#テクノロジー
What Are We Doing?
3.0
新しいClaude Opus 4.7モデルへの不満から、閉鎖的な企業が開発する強力なAI技術の危険性を訴える。ベンチマークでは高知能だが意図に沿わず、社会全体でAIのアライメントを決定すべきだと主張する。
hn2026年4月20日#テクノロジー
Opus 4.7では画像のコストが3倍に
3.5
Anthropicの最新モデルClaude Opus 4.7では、画像処理のトークンコストが大幅に増加し、以前のバージョンと比較して約3倍のトークンを消費することが明らかになりました。この変更は、画像関連のプロンプトを扱う際のコスト効率に大きな影響を与える可能性があります。
hn2026年4月20日#テクノロジー
あなたのモデルは閉ループだから崩壊している
3.0
AIモデルが閉ループで訓練されると、外部からの新しい情報が遮断され、現実との乖離が生じる。これによりモデルの性能が低下し、最終的に崩壊に至る。オープンなフィードバックループの構築が持続可能なAI開発には不可欠である。
hn2026年4月20日#テクノロジー
ローカルLLMのテスト
1.0
著者がローカルで実行する大規模言語モデル（LLM）のテストについて述べています。ローカルLLMのセットアップ、パフォーマンス評価、実用的なユースケースについて考察し、クラウドベースのソリューションに依存せずにAI機能を活用する方法を探っています。
hn2026年4月21日#テクノロジー
オープンウェイトモデル：本番LLMデプロイメントのための厳選ガイド
2.5
このガイドは、本番環境での大規模言語モデル（LLM）デプロイメントに焦点を当てたオープンウェイトモデルの厳選リストを提供します。モデルの選択、最適化、デプロイメントのベストプラクティスをカバーし、実用的な実装を支援します。
hn2026年4月20日#テクノロジー
Kimi 2.6 vs. Opus 4.7 and Cabbages
2.0
Kimi 2.6とOpus 4.7、Cabbagesの比較記事です。これらの技術スタックやツールの特徴、パフォーマンス、ユースケースにおける違いについて分析しています。
hn2026年4月20日#テクノロジー
Opus 4.7 – 誰も好まない最高のモデル
2.0
Opus 4.7は技術的に優れた性能を発揮するモデルですが、その複雑な実装や特殊な要件から、多くの開発者からは敬遠される存在となっています。最高の性能を持つにもかかわらず、実際の採用には至らないという皮肉な状況が生まれています。
hn2026年4月20日#テクノロジー
Claude Opus 4.7ガイド
1.0
Claude Opus 4.7の包括的なガイドで、その機能、ユースケース、ベストプラクティスを解説します。この最新バージョンのAIアシスタントを最大限に活用する方法を学びましょう。
hn2026年4月21日#テクノロジー
Claude Opus 4.7 vs. 4.6: 何が変わったのか？
2.0
Anthropicの最新モデルClaude Opus 4.7では、4.6と比較して推論能力の向上、コード生成の精度向上、数学的推論の強化、長文コンテキスト処理の改善などが実現されています。これらの変更により、より正確で信頼性の高いAIアシスタントとしての性能が向上しました。
hn2026年4月20日#テクノロジー
Claude Token Counter、モデル比較機能を追加
2.0
Claude Token Counterがモデル比較機能を追加し、様々なClaudeモデル間でのトークン使用量を並べて比較できるようになりました。これにより、プロンプトの最適化とコスト管理がより効率的に行えます。
hn2026年4月20日#テクノロジー
ChatGPT voice mode is a weaker model
3.0
OpenAIのChatGPT音声モードは、古くて性能の低いモデル（GPT-4o時代のモデル）で動作しており、知識カットオフは2024年4月となっている。多くの人が音声対話AIは最も賢いと思いがちだが、実際にはそうではないという指摘。
simonwillison-net2026年4月10日#テクノロジー
Gemma 4 audio with MLX
2.5
MLXとmlx-vlmを使用して、macOS上でGemma 4 E2Bモデル（10.28GB）で音声ファイルを文字起こしするuv runレシピを紹介。14秒のWAVファイルで試した結果、ほぼ正確な文字起こしが得られたが、一部の単語を誤認識した例も示されている。
simonwillison-net2026年4月12日#テクノロジー
なぜ新しいAIモデルが優れているかを判断するには数ヶ月かかるのか
3.0
新しいAIモデルの実力を評価するのは困難だ。公式評価（evals）はマーケティングツールとなりがちで、直感的な「バイブチェック」も信頼性に欠ける。実際の業務でモデルを試すには時間と労力がかかり、モデルが人間より賢くなると、その進歩を認識すること自体が難しくなる。これがAI進歩が停滞しているように見える一因かもしれない。
seangoedecke-com2025年11月22日#テクノロジー
継続的学習の何が難しいのか？
3.0
AIモデルの継続的学習は、技術的には可能だが、モデルを改善する方向での学習を自動化すること、安全性の問題、学習内容の移植性など、実用的な課題が多い。単にモデルを継続的に訓練するだけでは、むしろ性能が低下する可能性があり、人間の監督が必要な領域である。
seangoedecke-com2026年2月23日#テクノロジー
MoEエキスパートルーティングを可視化する小さなツール
1.5
Mixture of Experts（MoE）モデルがトークンを異なるエキスパート間でどのようにルーティングするかを可視化する小さなツールを構築しました。実際に見ていると本当に魅力的です。
martinalderson-com2026年4月13日#テクノロジー

次の 30 件を読み込む最終更新 —