【要約】Why SWE-bench Verified no longer measures frontier coding capabilities [Hacker_News] | Summary by TechDistill

> Source: Hacker_News

Execute Primary Source

// Discussion Topic

記事の主題はAIのコーディング能力評価だが、コメント欄では以下のUX問題が提起されている。

・自動翻訳の強制的な適用
・翻訳を無効化する設定の欠如
・機械翻訳による不自然な語彙（例：「codage de pointe」）

技術的な議論ではなく、ローカライズの設計に関する不満が主題である。

// Community Consensus

技術的な合意形成はなされていない。単一のユーザーによる、自動翻訳の挙動と品質に対する批判のみである。

【批判の内容】

・翻訳機能の強制適用
・無効化ボタンの不在
・翻訳精度の低さ（不自然な表現）

【結論】
技術的な議論は存在せず、UXへの不満に終始している。

// Alternative Solutions

・翻訳機能を明示的にオフにできるボタンの設置

// Technical Terms

Senior Engineer Insight

> 技術的な議論が皆無であり、本スレッドからAI評価に関する知見は得られない。しかし、UX設計の観点では教訓がある。ユーザーの制御を奪う自動翻訳は、情報の正確性を損なうリスクが高い。特に「codage de pointe」のような不自然な訳は、専門家の信頼を失墜させる。システム実装においては、ユーザーが言語設定を即座に制御できる手段を確保すべきである。