Scale AIとCenter of AIの研究によると、AIエージェントはUpworkのタスクの97%を基本的な水準さえ達成できないことが判明しました。この研究では、6つの異なるAIモデルを用いて、ライティング、デザイン、データ分析など、様々なカテゴリーのUpworkプロジェクト240件に取り組み、その結果を実際のフリーランサーの結果と比較しました。.
調査によると、最も優れたAIモデルであるManusは、タスクのわずか2.5%しか成功させられず、提示された143,991ドルのうち約1,810ドルしか獲得できませんでした。Claude SonnetやGrok 4などの他のAIモデルは、タスクの2.1%しか成功させられませんでした。.
研究者はAIがすぐに仕事を奪うことはないと考えている
研究者たちは を発見しました 。また、AIが人間の仕事を代替することは当分ないだろうという点でも意見が一致しました。
欧州放送連合(EBU)とBBCの調査によると、 ChatGPT、Copilot、PerplexityなどのAIモデルはニュース報道に向いていないことが明らかになりました。調査では、AIモデルが情報源の特定、正確性、テキスト生成、意見と事実の区別といった重要な基準を満たしていないことが明らかになりました。
AIモデルは回答の45%に少なくとも1つの重大な問題を抱えていましたが、正しく評価されたAI回答はわずか31%でした。AI回答の20%は誤りで、古い情報や幻覚的な詳細が含まれていました。全モデルのうち、Geminiは回答に重大な問題の76%を記録しました。.
Freelance.comは を発表しました 。同社はまた、スキルレベルが上位5分の1に属する熟練労働者の採用頻度が以前より19%減少している一方で、下位5分の1に属する熟練労働者の採用頻度が14%増加していることも明らかにしました。
この調査は、8月に発表されたMITの調査報告書を裏付けるもので、95%の組織がAIへの総額300億ドルの投資から何の利益も得られていないという結論が出ています。MITとBasis ResearchのWorldTestによると、AIエージェントはパターンマッチングや単語予測はできるものの、世界の内部モデルの構築には苦労しています。.
この研究では、43のインタラクティブな世界における129のタスクが検討され、AIは世界の隠れた側面を予測し、目標を達成するための行動のシーケンスを計画し、環境のルールがいつ変化するかを判断することが求められました。研究者らはまた、517人の人間に対して同じタスクをテストし、人間はほぼ最適なスコアを達成するのに対し、AIモデルは頻繁に失敗することがわかりました。.
研究者らは、人間が を発揮する のは、直感的に環境を理解し、視点を調整し、実験を行い、ゼロから始め、戦略的に探索する能力を持っているからだと主張した。この研究によると、既存のモデルに計算能力を追加しても効果はなく、43の環境のうち25の環境でしか役に立たないという。
暗号通貨とAI担当大臣がソーシャルメディアにおけるAIによる検閲を警告
MITスローン研究所の研究者とSafe Securityは、ランサムウェア攻撃の80%がAIによるものであることを発見しました。サイバーセキュリティ・アームズ・レースによる2,800件のランサムウェア攻撃の調査によると、敵対的AIはマルウェアの作成、フィッシングキャンペーン、ソーシャルエンジニアリングを目的としたディープフェイク通話など、攻撃シーケンス全体を自動化していることが判明しました。.
研究者のケビン・ボーモント氏は、生成型AIはそれらの研究のいずれにおいても主要な要素ではないとして、この研究結果に異議を唱えている。研究者のマーカス・ハッチンズ氏も をばかげていると評し 、思わず笑ってしまったと付け加えた。
「この論文はほとんどナンセンスで、呆れるほどひどい。あまりにもひどいので、どこから話せばいいのか分からないほどだ。」
–ケビン・ボーモント、Mediumのセキュリティ研究者。
暗号通貨とAIの権威であるデイビッド・サックス氏は、 述べ た。彼は、「ウォークAI」という言葉では現状を説明するには不十分であり、問題を矮小化してしまうと主張した。そして、権力者の現在の政治的意図に沿うように、リアルタイムで回答を歪曲し、嘘をつき、歴史を書き換えるという、オーウェル的なAIを指摘した。

