現在の祈りの総数は

ケニア

ChatGTPも所詮教師型機械学習エンジン

ChatGTPの回答の精度はどんどん上がっていって、人間が回答を用意する時間、労力を考えると、非常に高速に、かなり品質の高い回答を提供します。

精度を上げるためには、より多くのサンプルデータが必要であり、そのデータが何を示しているかのインデックスをつけます。そして、それを機械学習エンジンに投入し、学習させます。(コンピュータ業界では食わせるといいます。)
簡単なのは、犬の写真とインデックスとして「犬」を割り当てます。猫の写真であれば「猫」のインデックスを紐づけます。
写真によっては、、インデックスは複数になるでしょう。
では、そのサンプルデータ、インデックス(最近タグといってますね)は誰が作るかというと、、人間。
何十万でも大変ですけど、インターネット上にあるデータは軽く億を超えているでしょう。
それらをロボットに捜査させ、データを取り込み、インデックス(タグ、ラベル)をつけて、食わせますw
問題となるのは、誰がそのタグをつけるか。そのつけたタグは正しいのか。あやまったタグをつけた場合、修正できるのか。
入力しようとするデータとタグの関連性について、人の価値観がどうしても投入されてしまいます。
また、膨大な量のデータにタグ付けされるのに人が介在せざるを得ないということは、そこの大量の人員を導入することが必要になってきます。
そして、誤って入力されたデータとタグを修正することはできるのか?という疑問です。記憶の上書きというところでしょうか。果たして、学習しなかったことにできるでしょうか。
いまChatGTPで盛り上がっていますね。ちょっと使ってみましたけど、、日本語では、精度が高くない印象です。言語の壁?サンプルが少ない?というところでしょうか。

ChatGTPに関しては欧米で賛否両論が出ています。ChatGTPの利用を禁止する大学がでてきたり、国でも抑制することを検討しているところも出てきています。イーロンマスクも開発を一時期停止しようと提言していますね。

使い勝手や、精度について様々な議論がでていますが、違う観点で面白い記事がありました。

https://time.com/6247678/openai-chatgpt-kenya-workers/

ここでは、サンプルデータ(教師データ)を作成をOpenAI社がアウトソースをしている状況が見えてきました。
教師データを作成するに当たってケニア人労働者を使っていた(時給2ドル以下)。
そして、仕事の内容ですが、暴力、性差別、人種差別を表現しているデータとそのラベリングをすることとだったようです。
このような表現をさせないようにするにはこのような教師データは必要です。そうでないと、ChatGTPは、人間が問いかけた内容について、異常性を認識せず、そのままインターネット上で収集したデータから異常をもったまま回答することになります。これは、いずれ、人間自体がChatGTPによって異常を無意識のうちに学習してしまう可能性があります。しかし、この教師データをつくるのは、人間です。ラベリングでも、暴力、アダルトというような単純なラベルにならないでしょう。そのなかでもレベルがあります。R指定でも、こまかく基準ありますね。サンプルデータから教師データを作成する人は、ある程度集中力を持続しながら、行うことになります。

「。。。。する男の生々しい描写を読んだ後、繰り返し幻覚を見ることに苦しんだとTIMEに語った。"あれは拷問だった "と彼は言った。"そのような文章を一週間を通していくつも読むことになります。金曜日になる頃には、その絵を通して考えることで心が乱れてしまいます」(一部翻訳)

確かにケニアでは高収入の労働かもしれません。でも、精神をむしばんでいく可能性は否定できません。

ケニアが豊になり、平和で、幸せになりますように祈りませんか?
(本当はいろいろ言いたいことはありますが、最終的にはこれだと思います)

ケニアが平和でありますように

-ケニア
-,