<吉祥寺残日録>シニアのテレビ📺 BS世界のドキュメンタリー「生成AIの正体 シリコンバレーが触れたがらない代償」 #240425

「ChatGPT」の登場とともに「生成AI」という言葉が世間で頻繁に聞かれるようになったのは、ついこの1−2年のことだろう。

簡単に言葉で指示を出しだけで、それっぽい文章や画像をいくつも作ってくれる便利なツール。

様々な選択肢を示してくれるので、人間はその中から一番気に入ったものを選べばいい。

巨大IT企業が競って開発にしのぎを削る生成AIは、果たして人類の未来に幸せをもたらすのだろうか?

経済成長と最新技術を疑うことなく推し進めるアメリカや中国とは一線を画し、多様性を重んじるヨーロッパでは正体不明の生成AIに疑いの目を向ける人も少なくない。

昨夜放送されたBS世界のドキュメンタリー「生成AIの正体 シリコンバレーが触れたがらない代償」も昨年オランダで制作された作品だ。

NHKのサイトを見ると、次のように作品の中身が紹介されている。

『インターネット上などの膨大な情報を学習し、文章や画像、音楽など、様々なコンテンツを自動で生成する「生成AI」。社会を変える期待が高まる一方で、膨大なデータを処理しているのが低賃金の労働者であることはほとんど知られていない。また、データの元となるネット情報には不正確なものや偏ったものが多い。便利さの代償として私たちが受け取る未来とは。』

AIを開発するエンジニアでさえ、AIがどのような計算を行なってこの答えを導き出しているのかを説明できないというこのテクノロジーは、私たちをこれまで人類が経験したことのない未知の領域に連れて行こうとしているのだ。

「よく知りもしないテクノロジーをあまりにも信用しすぎている」

セルビア人のメディア研究者ヴラダン・ヨーラーが発する警告に、耳を傾けてみよう。

アルゴリズムのプロセスの全体像を描いたという彼の前衛的な作品は、ニューヨーク近代美術館にも展示されている。

ヨーラーが暮らすセルビアの町ノビサドの画像を作るよう生成AIに指示すると、あっという間に大きな川が流れ中世の面影を残す風景が4枚作成された。

AIへの指示を意味する「プロンプト」を文字で入力するだけ。

この場合だと、プロンプトに『曇りの日 ノビサドの風景』と入力するだけでこうした画像の選択肢をAIが示してくれる。

ただこの画像は人間が撮影した写真ではない。

学習した膨大な画像データをもとにAIが作成したもので、実際の町の写真と見分けがつかないほどの出来栄えだ。

問題はどのような情報をどのように学習しているかがブラックボックスになっていて、ほとんど公開されていないということだ。

私たちは、日々使っているデジタルサービスがどのような仕組みで動いているかについて、知識も関心を持たないままに頼り切っている。

たとえばAIスピーカーを使って部屋の電気を消そうとする場合、ユーザーが発した命令は一瞬のうちにアメリカまで送られたのちにデータセンターで処理されユーザーの部屋の照明をオフにするのだ。

立ってスイッチを消せば済むことをわざわざ地球規模の情報伝達を使って処理しているのである。

「クラウド」という言葉もすっかり定着し私たちも気軽に使っているが、その実態は「人々の血と汗と金属でできた空の雲とは大違いのクラウド」だとヨーラーは指摘する。

シリコンバレーの企業はアルゴリズムやデータセンターなど表に出さないものは全てクラウドと呼ぶ傾向があります。このクラウドの中でAIにプロンプトを与えると、何もないところから生まれ出たかのように結果が現れます。

ヨーラー『世間でAIと呼ばれる仕組みは基本的にアルゴリズムとデータに基づいて機能します。大量のデータを処理し、パターンを識別する能力を持っています。ただし、AIは何も知りません。物事を知る能力を備えていないのです。データの集合体「データセット」の中にあるデータを統計的に反映させているにすぎません。』

シリコンバレーの企業が隠したがるものを彼らのAIを使って可視化したらどうなるでしょうか?

まずはチップから始めてみましょう。チップはコンピューターが計算をする上で欠かせない部品です。チップの主要な素材シリコンの原料となるのが「珪砂」と呼ばれる砂です。世界で使われる珪砂のおよそ7割が中国で生産されています。

引用:「生成AIの正体」より

番組では、プロンプトに「中国 新疆の珪砂鉱山」と入力する。

すると立ち入ることができない新疆ウイグル地区の鉱山の想像画像をAIが描き出した。

そこで働いているであろう労働者の顔まで。

AIが作り出した実在しない鉱山や労働者の画像はあまりにリアルで驚くと同時に、リアルとフェイクの境界線が崩れている現状に対する危機意識を改めて感じざるを得なかった。

どうしてAIは望み通りの様々な画像を生成できるのでしょうか?

ヨーラー『第一段階は大量のデータを集めるところから始まります。AIに学習させるためのデータセットにするのです。第二段階はデータの分類です。たとえば、樹木の形を識別し画像を生成するAIを作るとしましょう。そのためには何千種類という木の画像を読みこまさなければなりません。そこで必要となるのは画像を一枚一枚分類する生身の人間です。これは木だ、これは違う、これは何々という木だという風にね。裏方の仕事ですが集中力が必要とされます。こうして整理分類された何千種類もの画像データをもとにして樹木の画像を生成するための統計的な仕組みを作り出します。生成されるのは画像というより多次元な統計的な空間です。言い換えるなら「ハルシネーション=幻覚」です。統計が作り出す幻とも言えます。』

引用:「生成AIの正体」より

AIに読み込ませるデータはどのように分類されるのか?

ベルリンにあるワイゼンバウム研究所に所属するミラグロス・ミセリはAIの陰で働く「コンテンツ・モデレーター」に匿名で話を聞いた。

『私はオマル。コンテンツ・モデレーターの仕事をしています。勤務先は外部委託の会社です。たとえばSNSにユーザーからの投稿がありますよね。その投稿が「不快なコンテンツ」かどうか私たちがチェックして管理します。警察みたいなものです。法律に違反するもの、いじめやヘイトスピーチなど、もっとキツいものだと自殺とか児童ポルノとか、テロリストが人の頭を切り落としているような映像もあります。私たちが分類したデータをAIに学習させるのです。データが細かく分類されていると、その分AIの判断能力も向上します。私が働く会社には1000人ほどの従業員がいます。学生やドイツ語を話せない人も多く、彼らにとっては慣れ親しんだ言語や英語を使って働けるいい仕事です。この職を失うとみんな困ると思います。ドイツでの滞在許可を取り消されるかもしれませんから。ドイツのパスポートを持っていない人が80%かそれ以上でしょうね。私も正確にはわかりません。』

ミセリ『AI関連の企業は人間の労働者がいること自体公にしたがりません。データを処理する労働者の存在を開示せず、彼らがどこでどんな条件も下、どれぐらいの報酬で雇われているのかも語ろうとしないのです。最先端のAIを開発している企業にとっては聞こえのいい話ではありませんよね。我が社の提供する素晴らしいAIは時給数ドルにも満たない報酬で働くケニアの労働者たちによって訓練されていますなんて。最近登場したチャットボットを訓練したのはシリアの労働者たちです。戦火に見舞われた街で暮らしながら出来高払いで働いています。誰もこういうことを表沙汰にしたがらないのです。』

引用:「生成AIの正体」より

AIに読み込ませるデータセットがほとんど外注され、世界各地の低賃金労働者が関わっていることは正直知らなかった。

言葉がわからなくても木の映像を選び出したり、残酷な画像を削除したりすることはできる。

日本でも主婦たちの低賃金の内職としてこうしたデータを分類する仕事が行われているという話を聞いたことがあるが、巨大IT企業は世界的なレベルで立場の弱い低賃金労働者を利用しているということか。

ただ人力によるデータの収集や分類は効率が悪いため、近頃AI開発企業は「コモン・クロール」などが提供する自動的に収集された巨大なデータセットを利用するようになった。

「コモン・クロール」はアメリカの非営利団体で、インターネット上にある世界中のウェブサイトを巡回し自動的に膨大なデータを収集・蓄積している。

しかしインターネットから自動で吸い上げられたデータにはステレオタイプに陥りやすい。

たとえば、「美しい」という言葉の多くは裸の女性の画像データと紐付けされていて、検索するとポルノサイトの画像が大量に出てくるという。

ヨーラー『私たちが向かっているのは平均値を理想とする世界です。統計的に見れば進歩なのかもしれませんが、微粒子は皆失われて行きます。文化や社会における微粒子とは私たちのことです。それぞれに立場や考え方の異なる人々、一人ひとりの個性的な微粒子です。しかしAIのような統計に基づくシステムは、凡庸であることへ傾いていくのです。』

AIの開発が始まって以来、18か月ごとにコンピューターの計算能力は倍増してきた。

さらにこの数年は半年で倍増するようになった。

AIに使用されるチップは1個1万ドル前後、これを2万5000個ほど使用するため、AIを一つ開発するのに数億ドルは必要になる。

ChatGPTはバージョンアップするごとに計算能力が100倍に増えていて、そのためには開発コストもだいたい100倍必要になるという。

その金額を出せるプレイヤーは自ずと限られてくる。

ヨーラー『より多くの力と、より多くの資金と、より多くの処理能力が必要になるのであれば、とてつもなく重要な疑問が湧きます。これを作れるのは誰なのかという問いです。誰が作るかという問いは、このツールの所有者は誰になるのか、を問うことでもあります。基本的には必要とされるツールの所有者がその後のゲームを支配することになるのです。』

引用:「生成AIの正体」より

自身のデジタルクローンを作ろうとしているマサチューセッツ工科大学のタマエ・ベシログルは、AIについて次のような懸念を口にする。

ベシログル『学習中のAIが実際何を学んでいるのか、明確に知ることはできません。内部の動きは見えないのです。AIを学習させるためのコードを書いている人間にもわかりません。少なくとも私の知る限り、こういう動作をさせるためにはこういうデータが必要だという厳密な理論はありません。闇雲に大量のデータを与えては、どうなっているかよくわからないけど上手くいったからまあいいかとみなしているんです。今のところこうした大規模AIシステムの中で何が起きているのかまともな説明はありません。いわゆるブラックボックスです。指示を入力してから結果が出てくるまでの処理過程を誰も詳らかに説明することができないんです。』

ブラックボックス。この内部で何が起きているのかを正確に知るプログラマーがいない状況で、AIの性能を上げるにはより多くのデータを集めるしかありません。

ベシログル『たとえば対話型のAI「ChatGPT」の最新版では学習期間におよそ1兆の単語が使われています。書籍やウィキペディア、品質の高いニュースの発信元や科学的な文献などから調達します。文学のような長文の素材も重要視されます。機械学習に携わる人々は、質の良いデータセットを構築するためにこうしたものを優先してきました。質の良くないデータセットの場合は、ネット上に転がっているデータをメインに使います。たとえばさまざまなトピックについて匿名で書き込める掲示板とかSiriにハマっているフォーラムとか、ソーシャルメディアでの書き込みやメッセージアプリで交わされる短い会話も該当するでしょうね。でもおそらく私たちは、というかAIを開発している企業はあと5年も経たないうちに人類がこれまでに生み出したデータの大部分を収集し尽くしてしまうはずです。』

ヨーラー『何か対策を見出さなければ、あと1〜3年のうちに私たちの世界はコンピューターが生成したコンテンツに完全に汚染されてしまうでしょう。理論上はあと数年で機械が作ったコンテンツの量が人間が生み出したコンテンツの量を超えます。ふざけた話ですよ。統計学を駆使した高度なシステムがガラクタを生み出すために作られている。オートメーションでニセ情報を量産しているんです。そのうえ私たち人間は、この状況を招いた企業に情報の真偽を自動で見極める手段の開発まで求めています。全く逆の仕事をする2つのシステムを作れと言っているんです。一方で情報を作り出し、もう一方で情報を修正させようとしている、これは大きな間違いのもとになると思います。』

AIが作り出した世界に生きるということは、平均値を追い求める凡庸な世界に生きること。私たちはそれを望んでいるのでしょうか?

何が、そして誰が、私たちの未来を選ぶんでしょう?

一つだけ確かなことがあります。AIは雲の雫でも、魔法の箱でもありません。血と汗と貴重な金属を費やして作られるものなんです。

ヨーラー『AIが作り出すコンテンツは統計によって導き出された幻覚のようなものです。このことに気づけばむしろ興味深く感じられます。真実ではないと理解することが大切ではないでしょうか。』

引用:「生成AIの正体」より

私は生成AIを利用したことがないので、正直知らないことばかりだったが、コンテンツを制作していた人間として、昨今のニセ情報の氾濫には強い危機感を感じている。

だからAIについて深く知るヨーラー氏らの警告は衝撃的であり、民主主義の崩壊とAIを悪用する権力者の登場を予感させる。

世界の株式市場はAI関連株が牽引する形で上昇を続けてきたが、果たして人智を超えたAIが作り出す未来とはどんなものになるのだろう?

もっと勉強しなければならないと痛感しつつも、あまりにも理解不能な世界に入り込んでいて、もはや私にはキャッチアップできそうにない。

そのことが本当に恐ろしい。

AIビジネス

コメントを残す