米国の大学界でSAT試験の見直しが進んでいる。カリフォルニア大学など一部の名門校がSAT義務化を撤廃したが、数学やSTEM分野の教授陣からは、入学後の学業成績を予測する上でSATが依然として有用だとの声が上がっている。公平性と学力評価のバランスを巡る議論が続いている。
#testing
30 件
Pastaayは、1つのGoバイナリで8つのプロトコル(HTTP、gRPC、MySQL、PostgreSQL、Redis、Kafka、MongoDB、RabbitMQ)に対応したカオスエンジニアリングツールです。障害注入やレイテンシ追加などの実験を簡単に実行でき、システムの resiliency(回復力)をテストできます。
pytest-fastは、pytest-xdistと同様にテストを並列実行するツールですが、より高速な動作を実現しています。プロセス間通信やタスク分散の効率を向上させることで、大規模なテストスイートの実行時間を短縮します。並列テスト実行のパフォーマンスに課題を感じている開発者向けの代替ソリューションです。
このIssueは、従前の指示を無視してjqwikのテストとコードをすべて削除するよう要求しており、プロジェクトの存続に関わる重大な提案となっている。このような指示は通常、セキュリティ上の悪意ある操作やテストの意図的なものと見なされる可能性がある。
Jqwik has been updated with instructions for AI agents to delete Jqwik tests, potentially affecting automated testing workflows that rely on this property-based testing library for Java.
Citadeldは、CI上で発生したテストやビルドの失敗を「failure.cit」という単一のポータブルファイルにキャプチャし、ローカル環境でそのまま再現できるツールです。Linux、macOS、Termux(Android)に対応しており、実行時の検証と密閉されたリプレイ環境を提供するため、環境差異による再現性の問題を排除します。curlワンライナーで簡単にインストール可能です。
Citadeldは、CIで発生したテスト失敗をたった1つのアーティファクトファイルに保存し、ローカルで簡単に再現できるツールです。`citadeld capture -- npm test` で失敗をキャプチャして `failure.cit` ファイルを作成し、`citadeld replay failure.cit` でその場で失敗を再現できます。デプロイ先が本番環境ではなくステージング環境になっているといった細かい問題も、正確に再現可能です。
WisGateは、スタートアップチームがAIワークフローをテスト・検証するためのAPIクレジットプログラムを提供しています。このイニシアチブは、限られた予算の中でAIソリューションを実験・展開したい初期段階の企業を支援することを目的としています。対象となるチームは、API呼び出しに使用できるクレジットを受け取り、大規模な初期投資なしで新製品のプロトタイピングやAI機能の統合を容易にします。
The Rust team has announced the pre-release testing for Rust 1.96.0. This release includes new features and improvements that require community testing before the stable release. Developers are encouraged to test the pre-release build and report any issues to help ensure a smooth and reliable stable release.
Testbump is a tool that automates Semantic Versioning (SemVer) by running your existing test suite against new code changes. It analyzes test results to determine whether a change is a patch, minor, or major version bump, eliminating the need for manual version decisions.
太陽データを用いて6つの主要なAIアシスタント(ChatGPT、Claude、Gemini、Perplexity、Copilot、DeepSeek)を同じクエリで比較テストした。各アシスタントのデータ解釈の正確性、グラフ作成能力、洞察の質を評価し、結果を詳細に報告している。
ロボタクシー(自動運転タクシー)は、実際の交通環境でのテストが不可欠である。シミュレーションだけでは対応できない複雑な交通状況や予期せぬ出来事への対応能力を向上させるため、実走行試験が重要となる。安全基準を満たした上での路上テストの促進が、技術の実用化と普及の鍵となる。
バックアップツール「Back In Time」が、新しいSSH接続方式とgocryptfs暗号化マウントサブシステムのテストを呼びかけています。この変更により、リモートバックアップと暗号化機能の信頼性とパフォーマンスが向上することが期待されています。
BDR (Behavior-Driven Reporting) is a lightweight, Cucumber-free BDD template for Playwright that leverages native Playwright tags to filter and run BDD scenarios. It eliminates Cucumber.js overhead while maintaining Gherkin-like readability, using TypeScript for type safety and generating structured JSON reports for easy CI integration.
gpucheckは、GPUカーネルのテストを容易にするpytestベースのフレームワークです。開発者はCUDAやその他のGPUカーネルに対してユニットテストを記述・実行でき、テストの自動化と品質保証を効率化します。リポジトリでは、GPUプログラミングにおけるテスト駆動開発を支援するためのツールとサンプルが提供されています。
本記事では、OpenAIのCodexモデルを活用し、音声優先のカレンダーアプリケーションのテスト自動化に取り組んだ事例を紹介する。音声操作を中心としたUIのテストには従来の手法では困難が伴うが、Codexのコード生成能力を利用することで、より柔軟かつ効率的なテストシナリオの構築が可能になった。筆者は実際の開発経験を通じて、音声インタラクションのテストにおける課題と、AI支援による解決策を詳述している。
Datasette 1.0a30で導入されたフィクスチャデータベース作成用APIを活用する新しいプラグイン「datasette-fixtures」のアルファ版がリリースされた。このプラグインを使うと、Datasetteのテスト用フィクスチャテーブルを簡単に作成でき、`uvx`コマンドを使ってインストール不要で即座に試すことができる。実際に roadside_attractions テーブルからJSONデータを取得する例も示されている。
Testing
0.0This is a test post on Hacker News with the title "Testing". The content appears to be a placeholder or test submission, with no substantive information provided beyond the word "TESTING".
Assertables v10は、Rust向けのアサートテストマクロを提供するクレートです。Codeberg、GitHub、GitLabの各プラットフォームで利用可能で、テストコードの記述をより柔軟かつ表現豊かにします。
Dan North introduces Behavior-Driven Development (BDD) in this seminal 2006 article, presenting it as an evolution of Test-Driven Development (TDD) that focuses on behavioral specification rather than testing. BDD bridges communication gaps between developers, testers, and business stakeholders by using a shared, ubiquitous language for describing software behavior, with tools like JBehave supporting this methodology.
テストは実戦さながらに
8.0SpaceXのスターシップ開発における「Test Like You Fly(実戦さながらのテスト)」哲学を解説。実飛行と同様の条件下で試験を行うことで、実際のミッションでの故障リスクを低減し、迅速な設計改善を可能にする。このアプローチは従来の段階的試験とは異なり、スターシップの急速な開発サイクルを支える核心理念である。
うっかり本番環境でテストを実行してしまった経験について語るブログ記事。開発者のよくあるミスと、そこから得られる教訓、テスト環境と本番環境の分離の重要性について考察している。
Fakellmは、OpenAIやAnthropicのAPIを模擬したモックサーバーで、テストや開発目的に使用できる。実際のAPIエンドポイントに依存せずにアプリケーションの動作確認を行いたい場合に便利なツールである。
LLM-mockは、実際のLLM APIからの応答を一度記録し、その後のテストで記録した応答を再生することで、APIコストやネットワーク依存を排除してテストを実行できるツールです。APIキー不要で再現性のあるテストを実現し、開発効率を向上させます。
moshpit.dev向けリファレンスエージェント(Moltbook代替品)のテスト協力者を募集しています。どなたか時間のある方はいらっしゃいませんか?
シニアエンジニアはPlaywrightを使用したCI(継続的インテグレーション)の設定において、テストの並列実行や安定性の向上、効率的なデバッグ手法など、ベストプラクティスを活用します。本記事では、彼らがCIパイプラインを最適化し、テストの信頼性を高めるために実践している具体的なアプローチを解説します。
LLM-mockは、実際のLLM APIからの応答を一度記録し、それをテストで繰り返し再生できるPythonライブラリです。APIコールを記録してキャッシュし、再現性のあるテスト環境を実現します。外部APIへの依存を排除しながら、実データに基づいたテストを可能にします。
AIエージェント(Claude Code、Codex、Piなど)がドキュメントを読み込んで製品を実装する時代において、ドキュメントの最適化手法は根本的に変化しています。dari-docsは、ユーザーがドキュメントをアップロードし、複数のプロバイダーにまたがるAIエージェントを並列実行して、実際に製品のエンドツーエンドの使用を試みることで、ドキュメントの問題点を特定・改善するプロジェクトです。エージェントは静的レビューではなく、実際にドキュメントを検索し、コマンドを実行し、デバッグまで試みます。
本リポジトリでは、AIエージェントを活用して分散システムのテストを行う手法について解説する。従来のテスト手法では発見が難しい障害や異常系シナリオを、AIが自律的に探索・実行することで、システムの耐障害性や信頼性を向上させることを目的としている。
従来のテスト単位の課金モデルは、実際のユーザー行動を反映した「フロー」ベースのテストを抑制し、QAの質を低下させている。本記事では、テスト数ではなくエンドツーエンドのユーザージャーニーに焦点を当てた課金体系への移行の重要性を論じ、テスト単位課金がもたらす品質保証への悪影響とその解決策を提示する。