動画内など、他所でラテシンの問題を扱う(転載など)際について
ウミガメのスープ 本家『ラテシン』 
いらっしゃいませ。ゲスト様 ログイン 新規登録
項目についての説明はラテシンwiki

人件費を節約せよ(問題ページ

れは僕がネットサーフィンしていたら偶然知った話なんですけど、ある会社が古書を読み取ってテキストデータにしたいと考えたんですね。
でも古書は文字が整ってないので文字を読み取るには機械じゃ無理でどうしても人力で1文字1文字読み取らないといけないんです。
しかしこの会社は別の会社と提携することにより、人件費をほとんどかけずに読み取り作業を進めることができたのです。
いったいどうやったのかわかりますか?もちろんブラック企業とかではありませんよ。
16年06月20日 17:58
【ウミガメのスープ】 [UNC]



解説を見る
書をスキャンして画像データにするのは簡単なんですが、その画像に書かれていることをどう人出をかけず読み取るのかが問題な訳です。
そこで我々が会員登録とかで良くやらされる、画像の文字を読み取って書かせて機械でないことを証明させるアレをやってる会社と提携して、文字認証で2つの単語を入力させるようにしました。
1つ目は既に答えを知っている単語、2つ目はテキストデータにしたい古書の一部の単語が含まれた画像です。
サイトの利用者が2つの単語を読み取って入力すると1つ目の単語で認証が行われ、正しければ2つ目の単語も正しいと推測して単語の読み取り結果が保存されるというわけです。
これを膨大な利用者に対して行えば古書の全ての単語について単語の読み取り結果は保存され、古書のテキストデータ化が出来るというわけです。
利用者は知らず知らずのうちに古書のテキストデータ化に協力していたんですね。
総合点:1票  納得感:1票  


最初最後
納得感部門kinnsada
投票一覧
「これは、悪魔的発想っ......!元ネタありとのことですが誰かに教えたくなるアイディアです。」
2016年06月24日23時

最初最後