alt.languages.englishShow header Prev. Next
Re: used to http://groups.google.com
credoquaabsurdum (credoquaabsurdum@yahoo.com) 2005/07/15 16:21



Mike Lyle wrote:

> Hang about. (This is a genuine question, not a smart-arsery.) I'm
> taking "scan" in its restricted OCR-type meaning: you mean they do
> that? I wouldn't dream of getting evidence for a dictionary by that
> means, especially reading a wide variety of print styles.

OK, I'll try not to give you a "smart-arsey" response.

No. Many other organizations do it (or use "human OCR") in building up
corpora and literary collections. The publishing history of these
documents is almost always available when you access them: in major
projects like Project Gutenberg and LION, you can always trust what you
get.

There is a reading program that's been around forever: you can get more
information at askoxford.com.


Follow-ups:123456789101112131415161718192021222324
Next Prev. Article List         Favorite