人件費を節約せよ

Question

これは僕がネットサーフィンしていたら偶然知った話なんですけど、ある会社が古書を読み取ってテキストデータにしたいと考えたんですね。
でも古書は文字が整ってないので文字を読み取るには機械じゃ無理でどうしても人力で1文字1文字読み取らないといけないんです。
しかしこの会社は別の会社と提携することにより、人件費をほとんどかけずに読み取り作業を進めることができたのです。
いったいどうやったのかわかりますか？もちろんブラック企業とかではありませんよ。

Accepted Answer

古書をスキャンして画像データにするのは簡単なんですが、その画像に書かれていることをどう人出をかけず読み取るのかが問題な訳です。
そこで我々が会員登録とかで良くやらされる、画像の文字を読み取って書かせて機械でないことを証明させるアレをやってる会社と提携して、文字認証で2つの単語を入力させるようにしました。
1つ目は既に答えを知っている単語、2つ目はテキストデータにしたい古書の一部の単語が含まれた画像です。
サイトの利用者が2つの単語を読み取って入力すると1つ目の単語で認証が行われ、正しければ2つ目の単語も正しいと推測して単語の読み取り結果が保存されるというわけです。
これを膨大な利用者に対して行えば古書の全ての単語について単語の読み取り結果は保存され、古書のテキストデータ化が出来るというわけです。
利用者は知らず知らずのうちに古書のテキストデータ化に協力していたんですね。

答え

パズルじゃないのに

愛犬？ルンバ

【猛者のスープ】クウィーン・オブ・ハロウィーン

捨てる神あれば