これは僕がネットサーフィンしていたら偶然知った話なんですけど、ある会社が古書を読み取ってテキストデータにしたいと考えたんですね。
でも古書は文字が整ってないので文字を読み取るには機械じゃ無理でどうしても人力で1文字1文字読み取らないといけないんです。
しかしこの会社は別の会社と提携することにより、人件費をほとんどかけずに読み取り作業を進めることができたのです。
いったいどうやったのかわかりますか?もちろんブラック企業とかではありませんよ。
でも古書は文字が整ってないので文字を読み取るには機械じゃ無理でどうしても人力で1文字1文字読み取らないといけないんです。
しかしこの会社は別の会社と提携することにより、人件費をほとんどかけずに読み取り作業を進めることができたのです。
いったいどうやったのかわかりますか?もちろんブラック企業とかではありませんよ。
No.1[K-OS]06月20日 18:0106月20日 18:03
人力で読み取りましたか?
YES ※ミスリード注意 [良い質問]
No.2[せせらぎ]06月20日 18:0206月20日 18:04
古書の文字は普通の人では読むことができませんか?
NO 読むことができます [良い質問]
No.3[焼け石に油]06月20日 18:0206月20日 18:03
古書の文字が整っていないのは人が書いたためですか?
YESNO 重要ではありません
No.4[K-OS]06月20日 18:0306月20日 18:04
人件費が発生しなかったんじゃなく利益が生まれたのでプラスマイナス0になりましたか?
NO
No.5[K-OS]06月20日 18:0406月20日 18:07
タイピングアプリの会社と連携しましたか?
NOですが発想は近いです [良い質問]
No.6[鳴子]06月20日 18:0406月20日 18:07
古書は活字ですか?
YESとしておきます
No.7[鳴子]06月20日 18:0506月20日 18:07
古書のジャンルは重要ですか?
NO
No.8[K-OS]06月20日 18:0506月20日 18:08
会員制サイトのセキュリティで画像の文字を入力させるのは関係しますか?
YES [良い質問]
No.9[せせらぎ]06月20日 18:0606月20日 18:08
古書のすべてのページの写真を撮って数文字ずつに分割し、登録者がロボットではないことを証明するための会員登録の文字認証に使いましたか? [編集済]
YES 思ったより早かったww [正解]
No.10[鳴子]06月20日 18:0606月20日 18:08
画像の文字を入力させて人間かどうかを判別するセキュリティを提供する会社ですか?
YES [良い質問]
古書をスキャンして画像データにするのは簡単なんですが、その画像に書かれていることをどう人出をかけず読み取るのかが問題な訳です。
そこで我々が会員登録とかで良くやらされる、画像の文字を読み取って書かせて機械でないことを証明させるアレをやってる会社と提携して、文字認証で2つの単語を入力させるようにしました。
1つ目は既に答えを知っている単語、2つ目はテキストデータにしたい古書の一部の単語が含まれた画像です。
サイトの利用者が2つの単語を読み取って入力すると1つ目の単語で認証が行われ、正しければ2つ目の単語も正しいと推測して単語の読み取り結果が保存されるというわけです。
これを膨大な利用者に対して行えば古書の全ての単語について単語の読み取り結果は保存され、古書のテキストデータ化が出来るというわけです。
利用者は知らず知らずのうちに古書のテキストデータ化に協力していたんですね。
そこで我々が会員登録とかで良くやらされる、画像の文字を読み取って書かせて機械でないことを証明させるアレをやってる会社と提携して、文字認証で2つの単語を入力させるようにしました。
1つ目は既に答えを知っている単語、2つ目はテキストデータにしたい古書の一部の単語が含まれた画像です。
サイトの利用者が2つの単語を読み取って入力すると1つ目の単語で認証が行われ、正しければ2つ目の単語も正しいと推測して単語の読み取り結果が保存されるというわけです。
これを膨大な利用者に対して行えば古書の全ての単語について単語の読み取り結果は保存され、古書のテキストデータ化が出来るというわけです。
利用者は知らず知らずのうちに古書のテキストデータ化に協力していたんですね。
16年06月20日 17:58
[UNC]
[イイネ!(味が)]
相談チャットです。この問題に関する事を書き込みましょう。
鳴子>>せせらぎさん FAおめでとうございます。UNCさん 出題ありがとうございました。なかなか言葉で伝えづらいですよねアレって。[20日18時13分]
UNC[イイネ!(味が)]>>回答ありがとうございました せせらぎさんFAおめでとうございます 多分僕が目撃したサイトはこれですね→http://logmi.jp/28125[20日18時11分]
焼け石に油>>なるほど~出題お疲れ様です[20日18時11分]
K-OS>>出題お疲れ様でした せせらぎさんFAおめでとうございます 本当に使えそうなアイディアです[20日18時11分]
鳴子>>参加します。[20日18時04分]
焼け石に油>>参加します[20日18時01分]
UNC[イイネ!(味が)]>>皆さん歓迎します〜[20日18時01分]
K-OS>>参加します[20日18時00分]
ゲストの方は発言できません、ログインまたは登録してください。
Goodスープ認定
「Goodスープ認定」はスープ全体の質の評価として良いものだった場合に押してください。(進行は評価に含まれません)
ブックマークシステムと基本構造は同じですが、ブックマークは「基準が自由」なのに対しGoodは「基準が決められている」と認識してください。
「Goodスープ認定」はスープ全体の質の評価として良いものだった場合に押してください。(進行は評価に含まれません)
ブックマークシステムと基本構造は同じですが、ブックマークは「基準が自由」なのに対しGoodは「基準が決められている」と認識してください。