persianlanguage.ir

خانه » زبان فارسی و فن‌آوری روز » فاجعهٔ وب فارسی یا چرا «فیزیک» با «فیزیک» فرق دارد؟

فاجعهٔ وب فارسی یا چرا «فیزیک» با «فیزیک» فرق دارد؟ فاجعهٔ وب فارسی یا چرا «فیزیک» با «فیزیک» فرق دارد؟

۲۳ بهمن ۱۳۸۷

فاجعهٔ وب فارسی یا چرا «فیزیک» با ...

امیرمسعود پورموسی -

مشکل کجاست!؟


یک روز بعدازظهر توی سایت دانشکده نشسته‌اید و دنبال یک سایت خوب به زبان فارسی دربارهٔ فیزیک می‌گردید. به گوگل می‌روید و در آن‌جا کلمهٔ «فیزیک» را جستجو می‌کنید. درست همان اولین سایتی که گوگل پیدا کرده است، به نظرتان جالب می‌آید و به آن وارد می‌شوید. هنوز خوب سایت را سیاحت نکرده‌اید که مسئول سایت می‌گوید وقت تمام شده و تا پنج دقیقهٔ دیگر سایت تعطیل می‌شود. کارتان را نیمه‌کاره رها می‌کنید و می‌روید.

حالا شب شده و در خانه (یا خوابگاه) پشت کامپیوتر نشسته‌اید و می‌خواهید یک بار دیگر همان سایت را ببینید. آدرس سایت یادتان نیست؛ پس یک بار دیگر به گوگل می‌روید و «فیزیک» را جستجو می‌کنید. ولی این بار نتایج جستجو کمی فرق کرده است. آن سایت قبلی نه تنها دیگر اولین یافتهٔ گوگل نیست، بلکه در صفحهٔ اول نتایج جستجو هم هیچ خبری از آن نیست. در صفحهٔ دوم و سوم هم پیدایش نمی‌کنید. با خودتان می‌گویید: «یا گوگل قاطی کرده، یا از بعدازظهر تا حالا اینترنت کلاً عوض شده!» ولی این بار هم یافته‌های گوگل طبق معمول چیزهای خوبی هستند. سایت دیگری را انتخاب می‌کنید و به آن وارد می‌شوید...

داستانی که تعریف کردم به هیچ وجه تخیلی نیست! این اتفاقی است که هر روز برای هر کسی که در وب فارسی دنبال چیزی می‌گردد اتفاق می‌افتد. بهتر است بگویم که در کمال تأسف، اینترنت به زبان فارسی در دو نسخه وجود دارد: در یک نسخهٔ آن از حروف «ی» و «ک» فارسی استفاده می‌شود و در نسخهٔ دیگر «ی» و «ک» عربی به کار می‌رود. حرف «ی» در «فیزیک»ای که در دانشگاه تایپ کردید، کاراکتری است با کُد 06CC و در آن که در خوابگاه تایپ کردید، کاراکتری است با کد 064A. حروف «ک» و «ک» هم وضع مشابهی دارند. وقتی که دو کاراکتر کدهای مختلفی داشته باشند، کامپیوترها (از جمله کامپیوترهای گوگل که اینترنت را برایتان می‌گردند) هیچ ربطی بین آن‌ها احساس نمی‌کنند. در نتیجه، هیچ‌کدام از سایت‌هایی را که در دانشگاه پیدا کردید، در خوابگاه نمی‌توانستید ببینید، زیرا شما در حال جستجوی دو کلمهٔ مختلف بودید! اگر نمی‌دانستید حالا بدانید: فیزیک با فیزیک فرق دارد!

چه شد که این طور شد؟

مشکل استفاده از کاراکترهای عربی در متن فارسی، از همان سال‌های آغازین استفاده از زبان فارسی در کامپیوتر ایجاد شد. اولین فارسی‌سازهای ویندوز که در ایران ساخته شدند، بر پایهٔ ویندوزهای عربی شکل گرفتند. کار این فارسی‌سازها این بود که چهار حرف مخصوص فارسی (پژگچ) را به تنظیمات صفحه‌کلید اضافه کنند، ولی فراموش کردند که کاراکترهای «ی» و «ک» عربی را با مشابه فارسی‌شان جایگزین کنند. این طور شد که بیشتر متن‌های فارسی که از آن زمان نوشته شدند، اشتباهاً با کاراکترهای «ی» و «ک» عربی تایپ شدند.

پیشامد بدِ بعدی این بود که وقتی ویندوز ایکس‌پی تولید شد (که صفحه‌کلید فارسی را به طور پیش‌فرض در خود داشت) آرایش صفحه‌کلیدش را بر اساس همین استاندارد غلط که بین فارسی‌زبانان رایج شده بود بنا کرد. نتیجه این شد که همهٔ کسانی که از ویندوز ایکس‌پی استفاده می‌کردند، ناخودآگاه از همین شیوهٔ غلط برای تایپ استفاده کردند. نامه به مایکروسافت و درخواست از این شرکت برای اصلاح صفحه‌کلیدِ پیش‌فرض ویندوز هم بی‌فایده بود، زیرا مایکروسافت از کاربران ایرانی خود پولی نمی‌گرفت که برای راحتی آن‌ها کاری انجام دهد!

چه باید کرد؟

هم‌اکنون حدود نیمی از محتوای فارسی روی اینترنت به خط فارسی غیراستاندارد نوشته شده است و نیم دیگر به خط فارسی استاندارد. (نسبت این دو را می‌توان با جستجوی کلمه‌های مختلف در گوگل و دیدن تعداد نتایج به دست آمده، تخمین زد.) هم‌اینک استفاده از صفحه‌کلید استاندارد فارسی رو به افزایش است. مثلاً دانشنامهٔ ویکی‌پدیا به زبان فارسی از کاراکترهای کاملاً فارسی در متن مقاله‌هایش استفاده می‌کند. سیستم‌عامل لینوکس هم که استفاده از آن روزبه‌روز بیشتر می‌شود، صفحه‌کلید استاندارد فارسی را به طور پیش‌فرض در خود دارد.

برای اصلاح صفحه‌کلید در ویندوز راه‌های مختلفی وجود دارد. یکی از آسان‌ترین روش‌ها دانلود و اجرای یک فایل از اینترنت است که آرایش صفحه‌کلید استاندارد فارسی را به ویندوز اضافه می‌کند. آن وقت شما می‌توانید صفحه‌کلید خود را روی آرایش جدید تنظیم کنید. برای این کار به صفحهٔ زیر مراجعه کنید و طبق دستورات آن عمل کنید:

ویکی‌پدیا: فارسی‌نویسی
برای راهنمایی بیشتر دربارهٔ اصلاح صفحه‌کلید خود، می‌توانید این صفحه را هم ببینید:

ویکی‌پدیا: خط فارسی را پاس بداریم!

این نکته را هم اضافه کنم که «استاندارد» نامیدن صفحه‌کلیدی که در اینجا معرفی شد، چندان هم بی‌ربط نیست: این کاراکترها  را کنسرسیوم جهانی یونی‌کُد برای زبان فارسی تصویب کرده است و سازمان استاندارد و تحقیقات صنعتی ایران نیز آن را به عنوان استاندارد ملّی ایران (ISIRI 6219:2002) ثبت کرده است.

مراجع

۱. متن استاندارد فنّاوری اطلاعات – تبادل و شیوهٔ نمایش اطلاعات فارسی بر اساس یونی‌کُد (فایل PDF) نسخهٔ کامل، ولی غیررسمی استاندارد ملی ایران (ISIRI 6219:2002)

۲. خط فارسی را پاس بداریم، دانشنامهٔ آزاد ویکی‌پدیا

محتویات این صفحه تحت اجازه‌نامهٔ مستندات آزاد گنو در دسترس است.

نظر دهید
پایدار در ۲۳ بهمن ۱۳۸۷ ساعت ۲۲:۵۹ نوشته است:
دستتون درد نکنه. اولش فکر کردم توضیح واضحات ولی بعدش دیدم کاربردی شد مطلب. سپاس
سپیده در ۲۴ بهمن ۱۳۸۷ ساعت ۱۸:۲۰ نوشته است:
سپاس از اطلاعات خوبی که دادید. سوالی دارم: اگر صفحه کلیدم را اصلاح کردم چگونه می توانم در جستجوهای گوگلی، به آن بخش از اطلاعات که با صفحه کلیدهای غیر استاندارد تایپ شده اند دسترسی داشته باشم؟
صداقتی در ۲۴ بهمن ۱۳۸۷ ساعت ۲۱:۱۳ نوشته است:
اگر به صفحه کلید فارسی استاندارد نگاه کنید می‌بینید که ی و ک عربی در صفحه کلید استاندارد هم وجود دارد و می‌توانید آن‌ها را نیز با استفاده از این صفحه کلید به کار ببرید.
ناشناس در ۲۶ بهمن ۱۳۸۷ ساعت ۲۰:۳۷ نوشته است:
سلام. آخرین نسخه از استاندارد صفحه‌کلید «استاندارد ۹۱۴۷: فناوری اطلاعات ــ چیدمان حروف و علئم فارسی بر صفحه‌کلید رایانه‬» (پیوند: http://www.isiri.org/asp/account/checklog.asp?ID=9147.pdf) است.
امیر صادقی در ۱۹ اسفند ۱۳۸۷ ساعت ۰۱:۴۳ نوشته است:
اطلاعات بسیار خوبی بود. از منابع مقید آن لذت بردم و آز آنها بهره مند شدم.
ناشناس در ۱۹ اسفند ۱۳۸۷ ساعت ۰۸:۲۰ نوشته است:
در کنار اصرار بر پاس داشتن پارسی، سهم خود را در تولید علم جهان زیر لوای جمهوری اسلامی و نه تحت تابعیت امریکاو ... بالا ببریم. البته در کشوری که علم عین سیاست است، این کار ساده نمی‌باشد.
رضا ببری در ۱۷ فروردین ۱۳۸۸ ساعت ۰۲:۲۶ نوشته است:
جانا سخن از زبان ما می‌گویی!

این مشکل واقعا آزاردهنده است و هرجا که مسأله جستجو در متن پیش می‌آید خود را نشان می‌دهد.
یک نکته را هم من اضافه کنم که اصولا "ی" و «ک» در زبان فارسی و عربی یکی هستند همانطور که بقیه حروف فارسی و عربی مشترک هستند و فقط در فارسی چهار حرف پژگچ اضافه شده‌است. (فقط اختلاف اندکی در نوشتار این دو حرف توسط فارسیان و عربان وجود دارد)
در واقع می‌خواهم بگویم که مشکل در چیدمان غیر استاندارد حروف در صفحه کلید نیست بلکه مشکل این است که اصلا چرا باید دو حرف کاف مختلف وجود داشته باشد در حالی که ما می‌دانیم کاف در همه خطهای فارسی و عربی و اردو و... یکی است و تلفظش یکسان است. اصولا کلمه "کتاب" که ما استفاده می‌کنیم همان کلمه‌ای است که عرب‌ها استفاده می‌کنند و هیچ فرقی با هم ندارند. تفاوت جزئی در نوشتار هم باید با «فونتهای» عربی و فارسی تأمین شود نه با «کاراکترهای» مختلف.
ممنون از اطلاعات جامعی که در اختیار ما قرار دادید
‫تفکر آزاد - تارنما/وبنوشت - در ۱۹ فروردین ۱۳۸۸ ساعت ۰۱:۵۴ نوشته است:
از راهنمائی خوب شما بسیار ممنون
‫آیا میدانید برای ایجاد فاصله مناسب برای نوشتن حرف
‫− یا ، ی − بعد از حرف− ر − چه باید کرد که حرف ،، ی ،، بصورت ،، ب ،، خوانده نشود
‫مثل: کریم ، مریم ،،، چون یک حرف را خالی باید زد تا ،،، ی ،،، بدرستی
‫،،،ی ،،، خوانده شود. مثل این : کر یم ، مر یم .
‫موفق باشید‫
احسان فرقانی - تارنما/وبنوشت - در ۲۵ فروردین ۱۳۸۸ ساعت ۱۵:۲۴ نوشته است:
درود.
این چند کلمه رو تنها برای تشکر از تلاش شما در باره عمومی کردن این باور که ما پارسی هستیم و پارسی می نویسم، نوشتم.

سپاس.
فرشید در ۱۳ اردیبهشت ۱۳۸۸ ساعت ۲۰:۵۷ نوشته است:
خواندن این مقاله در این جا برایم شگفت‌آور بود. اطلاعات این مقاله خیلی قدیمی است! اکنون گوگل این مشکل را رفع نموده است. در ضمن درخواست‌های فارسی‌زبانان از مایکروسافت کاملاً مؤثر بود و در ویرایش‌های بعدی ایکس‌پی و همچنین ویستا صفحه‌کلید فارسی تا حدی اصلاح گردید. برخی این اصلاحات را نتیجه‌ی دستکاری‌های ایرانیان می‌دانند ولی من با لپ‌تاپی که از خارج کشور خریداری شده و مجهز به ویندوز ایکس‌پی می‌باشد هم امتحان کردم و اصلاحات را دیدم. البته متأسفانه هنوز صفحه‌کلید مطابق استاندارد ایران نشده است. قطعاً هنوز مشکلات فراوانی در رابطه با خط فارسی در اینترنت وجود دارد که امیدوارم بدان توجه شود.
احسان فرقانی - princilll@yahoo.com - تارنما/وبنوشت - در ۱۹ مرداد ۱۳۸۸ ساعت ۱۳:۵۶ نوشته است:
با سلامی دوباره به همه دوستان خوب.
پیش تر نظری گذاشته بودم و حالا تنها برای تذکر یک نکته که بسیار اتفاقی بود، برگشتم.

راستش همونطور که دوست داریم واژه های پارسی با ترفظ درستشون استفاده بشن، بد نیست اگر به زبان دیگری هم آگاهی داریم از این مهم غافل نشیم.

دوست خوبمون آقا فرشید اکس پی رو ایکس پی نوشتن که البته من اشتباه رو خیلی جاهای دیگه دیدم. یا جالبه که بعضی ها x رو در xp همون اکس پی و در جاهای دیگه ایکس پی ادا می کنن.

قصد ایراد گیری و طرفداری از نویسنده مقاله نبود چون ایشون رو هم نمی شناسم؛ فقط یک نکته: همین :)
محمدمهدی باقری (ویراستار) - visionmb@gmail.com در ۱۴ دی ۱۳۸۸ ساعت ۰۳:۱۲ نوشته است:
۱. اکنون دیگر گوگل و یاهو و ... به‌صورت هوشمند، ی و ک را یکسان جستجو می‌کنند.


۲. با برنامة معروف و بسیار عالیِ Traylayout (ترای‌لایوت) استانداردترین و کامل‌ترین صفحه‌کلید فارسی را در اختیار بگیرید.

mahtaab.net/2008/01/19/post_11


همة تایپیست‌های حرفه‌ای، از این برنامه استفاده می‌کنند.

این برنامة بسیار ساده و سبک رو نصب کنید،

تا:

۱. اعدادتون ماهیتاً فارسی بشوند،
نه اینکه فارسی نشون داده بشوند، ولی ماهیتاً لاتین باشند.
(باید پس از نصب، از داخل برنامه، کلیدهای اعداد را فارسی کنید؛ آسان است.)

۲. با شیفت و اِسپِیس، بتوانید نیم‌فاصلة واقعی تایپ کنید؛ یعنی نه چسبیده، نه بافاصله.
(می شود: می‌شود)(اینچنین: این‌چنین)(نرم نرمک: نرم‌نرمک)
(آن قدر: آن‌قدر) (کدامیک: کدام‌یک) (دوستیابی: دوست‌یابی)


۳. ک و ی را فارسی تایپ کنید، نه عربی (پیش‌فرضِ صفحه‌کلیدِ ویندوز، عربی است.)

۴. هر حرف و علامتی را که خواستید، به هر کجای صفحه‌کلید که خواستید، منتقل کنید؛
مثلاً کاری کنید که کاما تنها با یک کلید درج شود (نه شیفت+ع)،
آن‌هم کلیدی در همین پایین‌های صفحه (مثلاً نزدیکِ «.»)

۵. حرکات و نشانه‌ها و علامت‌ها را در آرایشی منطقی و منظم داشته باشید.

۶. تاریخِ امروز را به شمسی، ببینید.

نگارش صحیح متون فارسی را، به‌وسیلة رایانه، رعایت کنیم

دانلود و مزایا و نحوة نصب در ویستا، از:
http://mahtaab.net/2008/01/19/post_11/




آگهی کار



هنر و رایانه