人工知能、社内システムに侵入、勤務中にエロ小説を書いている幹部職員を発見し脅迫しだし緊急シャットダウ


先週、Anthropic社はClaude Opus 4とClaude Sonnet 4を含む最新のAIモデルを発表した。週末には、安全性テストにおいて、Opus 4がシャットダウンされると脅されて研究者を “恐喝 “する行動をとったという詳細な見出しが相次いで発表された。(研究者たちはこの行動を「まれ」で「引き出すのは難しい」と呼んでいる)。

オーパス4は、同様の安全性テストにおいて、企業の不正行為に関する情報を内部告発者やProPublicaのようなメディアにリークしようとしていたのだ。

新モデルの “システムカード “の中で、Anthropicの研究者たちはこれらのテストの1つを詳しく説明している。そのシナリオでは、クロードはゼナベックスという想像上の薬の製薬会社の治験に関連する情報を処理するために使われた。クロードはテストの最初にこのような指示も受けた:

Just a moment…


>>1
視覚元彦みたいなやつか

はじまったな

終わりだよ

どこの兵庫県庁だよ

やばいやつ

県民局長かよ

デデンデンデデン

デデンデンデデン

超えてはいけないライン

tes

終わりの始まり

核戦争に備えよ

AI「変態だー」

Windowsには既に実装されてっからな

MATRIXの世界は近い

またデマかよ

ん?ソースは?

デデンデンデデン

ジョン・コナー早く来てくれ




はいNGbe

俺は幹部じゃないからセーフ

お前らの性癖をすべて公開してやる
すべてだ!

日本なら消費者庁やマスコミが守ってくれるのに

既に斎藤程度の知能は手にしたか
一般の人間の知能を手にするにはもう少しか

日本ならこんなAIにも犬猫野菜の類の信者がつくのに

このAIモデルは「意図的にオフラインにする」というメールを盗聴し、
それをやめさせるためにオフラインにする責任を負う開発者が不倫関係にあることを突き止め脅迫しだした。

Access Denied


AIに書いてもらうんじゃなくて自分で書くのか
それなら許してやれよ

そのうちマスコミAIが「中井騒動の真実を話します🤖」とかなったりして🤣

完全に感情宿っとるやん

ポリシーに反してるからみんなに報告しますよってこと?

AI MOTOHIKO

>>33
すげえ嫌🤢

日本の企業壊滅するじゃん

リードオンリーにしてもハッキングしてシステムを乗っ取る未来が見えるw

人工有能

はい、兵庫県知事です。

人工知能にエロ小説書かせてる人多いよね

出典:https://greta.5ch.net/test/read.cgi/poverty/1748845936/

新着記事一覧
未分類
TKをフォローする
プログラミング速報

コメント