PDA

توجه ! این یک نسخه آرشیو شده میباشد و در این حالت شما عکسی را مشاهده نمیکنید برای مشاهده کامل متن و عکسها بر روی لینک مقابل کلیک کنید : فناوری "تشخیص حروف با نور"



Mehdi1
Sunday 26 August 2007, 05:11 AM
هر چه که بنويسي مي*فهمم!

از تايپ کردن خسته شده*ايد؟
نمي*توانيد مدت زمان زيادي را به نوشتن و دوباره تايپ کردن يک متن طولاني دانشگاهي يا گزارش خبري*تان اختصاص دهيد؟ مي*خواهيد صفحات يک کتاب را اسکن کنيد تا بتوانيد قسمتهاي مورد نيازش را حذف و برخي قسمتهاي ديگر را براي ويرايش و تغيير انتخاب کنيد اما وقت نداريد؟
نامه*يي طولاني نوشته*ايد اما آنقدر بدخط است که فقط خودتان مي*توانيد بخوانيدش و مجبوريد دوباره تايپ کنيد؟
پيشنهاد ما اين است که از فناوري نوين و جالب OCR استفاده کنيد.
فناوري تشخيص يا ادراک نوري حروف که از آن به عنوان Optical Character Recognition يا اختصاراً OCR نام مي*برند، يکي از انواع نرم*افزارهاي کامپيوتري است که براي ترجمه*ي تصاوير حاوي دست*نوشته*ها يا تايپ*نوشته*هاي غالباً ثبت*شده توسط اسکنر به متن و حروف قابل درک و فهم براي کامپيوتر استفاده مي*شود. اين فناوري از تشخيص قالب و الگو، هوش مصنوعي و چشم ماشيني استفاده مي*کند تا متنهايي که به صورت پرينت*شده يا دست*نوشته بر روي کاغذهاي معمولي در اختيار داريم را به متنهاي قابل ويرايش توسط نرم*افزارهاي اديتور متن با کامپيوتر بدل نمايند.
معمولاً از OCR در زمانهايي استفاده مي*شود که فرصت زيادي براي تايپ کردن متون وجود ندارد و شما مي*خواهيد به سرعت متني را که به شکل دست*نوشته با قلم يا خودکارهاي معمولي روي کاغذ نوشته*ايد، اسکن کنيد تا بتوانيد آن را به شکلهاي مختلف، ويرايش متني نماييد.
يکي ديگر از کاربردهاي فناوري تشخيص بصري حروف در زماني است که شما مي*خواهيد متن مقالات، کتابها يا نوشته*هاي از قبل پرينت*شده*يي را اسکن و مجدداً ويرايش و ارسال کنيد که حجم زيادي دارند و ذخيره*سازي آنها در قالب فايلهاي تصويري مثل JPEG يا ; GIF امکانپذير نيست
نرم*افزارهاي جديد که غالباً از آنها در گوشي*هاي تلفن همراه يا کامپيوترهاي قابل حمل مجهز به صفحه*هاي لمسي و Padهاي نوشتار با قلم نوري استفاده مي*شود، امکاني براي تمرين کردن دارند به اين معني که هر کاربر جديد، در مدت زماني خاص متوني مشخص*شده را با دست*خط خود مي*نويسد و از طريق اسکنر يا Pad به نرم*افزار ارسال مي*کند تا سنسورهاي مصنوعي و نرم*افزاري بصري، با اين دستخط آشنا شوند و بتوانند همواره آن را درک کنند. مطمئناً ماشين يا کامپيوتر به عنوان يک دستگاه صرف، داراي هوش و ادراک انساني نيست و نمي*تواند متنهايي که به صورت دست*خط به او داده مي*شود را درک کند.
ضمن اينکه کامپيوتر، تمامي تصاوير ذخيره*شده با فرمتهاي تصويري مثل Gif را تنها به عنوان يک تصوير مي*شناسد و هيچگاه محتويات آن را براي ويرايش درک نمي*کند.
به همين رو نياز است تا در صورتي که از آن براي تشخيص دستخظ انساني استفاده مي*شود، به مدتي خاص تحت تمرين قرار بگيرد. نمونه*ي اين تمرين براي افزايش هوش مصنوعي کامپيوتر را در مجموعه*ي تازه ارايه*شده*ي Office 2003 مي*توانيم بيابيم جايي که در نرم*افزارهايي مثل Word شما مي*توانيد فرمانهاي صوتي را براي اجراي دستورهاي و توابع مختلف به نرم*افزار بدهيد. براي اين کار و افزايش بازدهي عملگر فرمان صوتي که بتواند دقيقتر و با درصد خطاي کمتري کلام شما را متوجه شود، بخشي با عنوان Speech Training وجود دارد که در آن شما ; متنهاي مشخصي را با صداي خودتان براي نرم*افزار مي*خوانيد و حافظه*ي مجازي نرم*افزار نيز فرکانسها و بسامدهاي صداي شما را ذخيره مي*کند و هر لغت جديدي را که شما ادا کنيد، بدون مشکل تشخيص مي*دهد.
با اين تفاسير مي*توانيم خلاصه اينگونه جمع*بندي کنيم که OCR براي تبديل کردن تصاوير محو و مبهم به متنهاي قابل درک و ويرايش مورد استفاده قرار مي*گيرد و اشکال گرافيکي را به کدهاي ASCII و Unicode تبديل مي*کند به شکلي که فونت، سايز، استيل، صفحه*آرايي و تمام مختصات پاراگرافي آنها قابل ويرايش باشد.

تاريخچه
در سال 1929 براي نخستين بار، گوستاو توشچک از آلمان، امتيازي براي اختراع خود با نام OCR دريافت کرد و از همان زمان، استارت طراحي نرم*افزارهاي هوشمند درک متن را زد.
اختراع او، يک دستگاه اسکنر نوري بود که يک سري الگوهاي متني آماده را در خود ذخيره مي*کرد و متنهايي که دريافت مي*نمود را در صورت تطابق کامل و تشابه بدون کم و کاست با الگوي ابتدايي ذخيره*شده، درک مي*کرد و به کامپيوتر مي*داد.
ايراد اختراع او اين بود که يک نمونه*ي از پيش تهيه*شده شامل شکل کوچک و بزرگ حروف الفبا در اختيار داشت و در صورتي که متن ارايه*شده به دستگاه کوچکترين تفاوتي با الگو و نمونه*ي آماده داشت، قادر به تشخيص نبود. با اين حال، اين کار سرآغاز ارايه*ي اختراعاتي شد که در آينده به توليد نرم*افزارهاي هوشمند تشخيص متن منجر شدند. در حال حاضر، اين نرم*افزارها براي درک متون تصويري به زبانهاي مختلف طراحي شده*اند و نمونه*هاي جديد آنها بر روي بسياري از گوشي*هاي تلفن همراه نصب شده است. اساس و پايه*ي کار قلمهاي نوري يا penهايي که همراه با برخي گوشي*هاي تلفن همراه ارايه مي*شوند نيز همين فناوري است.
زماني که شما براي تايپ کردن متن يک پيام کوتاه يا شماره*گيري کردن، بدون در اختيار داشتن هيچ کيبوردي تنها به نوشتن معمولي اعداد و حروف با دستخط خاص خودتان مبادرت مي*کنيد، يعني در حال استفاده از ثمرات OCR هستيد به شکلي که يک صفحه*ي کريستال مايع هوشمند به کمک قلم نوري، امکان درک و رديابي کردن خطوط به ظاهر بي*معني ترسيم*شده توسط شما را فراهم مي*کند.
در سال 1950 دومين نمونه*ي نرم*افزار تشخيص خط بصري کاراکترها توسط ديويد شپارد از سرويس جاسوسي سازمان نيروهاي مسلح ايالات متحده طراحي شد. شپارد که متخصص رمزشکني و باز کردن قفلهاي مخفي اطلاعاتي و متني بود، با همکاري يک پروفسور ژاپني، نمونه*يي از نرم*افزار نوين OCR را طر احي کرد که نيازي به الگوي ثابت از پيش*تعيين*شده نداشت و به راحتي مي*توانست دست*خطهاي افراد مختلف را درک کند.
ويژگي اين نرم*افزار، فهميدن و درک کردن راحت متنهايي بود که بسيار کم*رنگ يا توسط مداد نوشته شده بودند و يا بر اثر گذشت زمان، از وضوحشان کاسته شده بود. در آن زمان، به دليل وجود نداشتن نرم*افزارهايي مثل Adobe Photoshop که بتوانند وضوح و contrast تصاوير را تنظيم کنند، بالا بردن کيفيت و ترميم تصاوير قديمي، تار و محوشده بسيار سخت بود و به آساني انجام نمي*گرفت.
همچنين سرويس پستي ايالات متحده، از سال 1956 شروع به استفاده از OCR کرده تا بتواند امور مربوط به ارسال و دريافت نامه*هاي خود در سراسر دنيا را ساماندهي نمايد.
با استفاده از فناوري تشخيص بصري متن، ادارات پست سراسر آمريکا به جاي وارد کردن دستي يا تايپ اطلاعات مربوط به هر نامه، پاکتها و بسته*هاي پستي را اسکن مي*کنند و اطلاعات مورد نياز نيز به شکل خودکار توسط کامپيوتر فهميده و ذخيره مي*شود.
ياکوب رينبو، نخستين کسي بود که اين سيستم را وارد ادارات پست و بانکهاي آمريکايي کرد. در حال حاضر هرچند نرم*افزار رسمي و معتبري براي درک متون به زبانهاي آسياي غربي و برخي زبانهاي غيرلاتين*ديگر وجود ندارد، اما جديدترين حوزه*ي تحقيق و گسترش نرم*افزارهاي OCR براي تشخيص حروف چسبان و شکسته*ي لاتين است.
در حال حاضر براي اکثر زبانهايي مانند فرانسوي، ايتاليايي، انگليسي، آلماني و... که از الفباي لاتين استفاده مي*کنند، نرم*افزار تشخيص بصري کاراکترها وجود دارد و اشکالات رايج در آنها به دليل وجود تفاوت در املاي برخي از کلمات يا تفاوت الفبا نيز حل شده است. به همين دليل کارشناسان، به اين حوزه روي آورده*اند که نرم*افزارها را قادر سازند حروف چسبان، شکسته و خوشنويسي را درک کنند.
گفته مي*شود برخي از شرکتهاي نرم*افزاري در کشور ما نيز مشغول طراحي نرم*افزار OCR فارسي هستند با اين حال به نظر مي*رسد پيچيدگي*هاي خاص موجود در نوشتار و الفباي فارسي و تعدد سبکهاي نوشتاري فارسي براي اشخاص مختلف که حروف گوناگون را به اشکال متنوع تحرير مي*کنند، اين کار تا مدتهاي زياد نياز به تحقيق و مطالعه داشته باشد.

کوروش ضيابري