یک درصد «سرچ» در موتورهای جستجو متعلق به ایران است/ امکان استفاده از «پارسی‌جو» در گوشی‌های هوشمند

طبق برآورد‌های صورت گرفته آمار پرس و جوهای ارسال شده از ایران روزانه ۱۰۰ میلیون و به اندازه یک درصد جستجوهای جهان بوده است به طوری که ۴ موتور جستجوی جهانی در ایران دارای رتبه زیر ۲۰ هستند.

کد خبر : 19405
تاریخ انتشار : پنجشنبه 16 بهمن 1393 - 20:30

به گزارش لنگرنیوز، موتور‌های جستجو یکی از پرکاربردترین ابزارهای اینترنتی هستند و در اکثر کشورها موتورهای جستجو رتبه اول تعداد بازدید کننده را داشته ضمن آنکه بالاترین درآمد‌ها در بین سایت‌های اینترنتی و شرکت‌های حوزه اینترنت از طریق موتورهای جستجو بوده است.

کمپانی گوگل با ۶۰ میلیارد دلار درآمد و ۹۶ درصد تبلیغات توانسته است ۷۰ درصد سهم جستجو خود را در آمریکا و ۴ میلیارد رکورد در روز را نصیب خود کند.

 

طبق برآورد‌های صورت گرفته آمار پرس و جوهای ارسال شده از ایران روزانه ۱۰۰ میلیون (یک درصد جستجوهای جهان) بوده است و  ۴ موتور جستجوی جهانی در ایران دارای رتبه زیر ۲۰ هستند.

صرفه اقتصادی، بازار بی رقیب، تبلیغات هدفمند، ارزش افزوده اطلاعاتی، ارائه سرویس‌های بومی متناسب با نیاز جامعه و تصمیم گیری مبتنی بر دانش از مزیت‌های موتورهای جستجوی بومی است به طوری که کشور چین در عرض سال‌های ۲۰۱۰ تا ۲۰۱۲ تبلیغات هدفمند متنی خود در موتورهای جستجو را ۱۲ برابر کرده است؛ چرا که موتورهای جستجوی بومی به دلیل شناخت بهتر زبان و فرهنگ که موجب فهم و پردازش بهتر زبان می‌شود، می‌تواند دسترسی کاربران محلی را به اطلاعات بیشتر و بهتر کند.
بر همین اساس و با توجه به اهمیت موتورهای جستجو، از اواسط سال ۸۹ زمزمه‌های استفاده از موتور جستجوی بومی در دستور کار وزارت ارتباطات و فناوری اطلاعات قرار گرفت و مقرر شد که موتور جستجوی ملی در بستر شبکه ملی اطلاعات شروع به‌کار کند. یک سال پس از تصویب این موضوع وزارت ارتباطات و فناوری اطلاعات به منظور ایجاد فضای رقابتی در میان نخبگان کشوری مصوب کرد تا راه‌اندازی چندین موتور جستجوی بومی در دستور کار قرار گیرد.

 

موتور جستجوی «پارسی‌جو» جزء اولین موتورهای جستجوی بومی قرار گرفت که وزارت ارتباطات آن را تایید کرد.
در همین راستا شب گذشته وزیر ارتباطات و فناوری اطلاعات به مناسبت ایام‌الله دهه فجر و  با حضور در دانشگاه یزد به عنوان طراح و سازنده موتور جستجوی بومی «پارسی‌جو» از این محصول بومی رونمایی کرد.
جزئیات موتور جستجوی بومی 

اجرای فاز تحقیقاتی موتور جستجوی پارسی‌جو در مرکز تحقیقات مهندسی دانشگاه یزد و شرکت «پارسی‌جو» در شهریور ۸۷ کلید خورد و طراحی و پیاده سازی آن در مهر ۸۸ آغاز شد. همچنین نسخه اول این موتور جستوی بومی در اردیبهشت ۸۹ با پوشش یک میلیون صفحه روی وب قرار گرفت. هم اکنون نسخه ۳ پارسی جو با پوشش ۲۰۰ میلیون صفحه روی وب قرار دارد.

استفاده بیش از ۱۰ سرویس متنوع برای ارتقاء کیفیت نتایج جستجو، پوشش ۲۰۰ میلیون سند فارسی، قدرت پاسخگویی به ۳۰۰ هزار پرس‌و‌جو در روز با حداقل سخت افزار و پهنای باند، استفاده از خزشگر ایساتیس با خزش ۲ میلیارد سند (هوشمند در تشخیص اسناد مهم) از جمله ویژگی‌های «پارسی‌جو» است.

سرویس خبر هوشمند، جستجوی آوا در یک میلیون فایل صوتی، سرویس‌های نقشه و سرویس تبلیغات هدفمند جزء جدید‌ترین بخش‌های این موتور جستجو هستند.

همچنین تعداد ۶۵ هزار جستجوی وب، ۴۵ هزار تصویر و ۳۰ هزار مابقی جستجوها (آوا، خبر، موبایل، دانلود) نیز جزئی از آمارهای فعالیت کاربران «پارسی‌جو»  است.

براساس گفته‌های تیم توسعه دهنده این موتور جستجو، اضافه کردن سرویس‌های بومی و محلی، ایجاد ایمیل و پروفایل سازی و افزایش تعداد کاربران جزء چشم‌انداز توسعه موتور جستجوی «پارسی‌جو» است.

مشخصان فنی موتور جستجوی «پارسی‌جو»
پارسی‌جو موتور جستجوی مستقل و بومی است که شامل سه بخش اصلی خزشگر، نمایه ساز و بخش بازیابی و جستجو است.
خزشگر پارسی‌جو که Parsijoo نام دارد به صورت هوشمند وب را پیمایش کرده و صفحات را جمع آوری می‌کند. در حال حاضر خزشگر پارسی‌جو، قادر به خزش ۲۰۰ میلیون صفحه وب به صورت متوالی است و نسخه جدید آن که به ‌زودی بر روی وب قرار می‌گیرد، قادر است بیش از یک میلیارد صفحه وب را جمع‌آوری کند.
در این بخش اسناد وب فارسی با یک سیاست مناسب بر مبنای پوشش و تازگی از وب جمع‌آوری می‌شو‌ند. یکی از اقدامات مهم این بخش کشف صفحات مهم فارسی است که این عمل با استفاده از الگوریتم جدید هوشمند به نام «ایساتیس» انجام می‌گیرد.
روش ایساتیس توسط طراحان پارسی جو ارائه شده که قادر است صفحات مهم فارسی را کشف و سپس بارگذاری ‌کند. همچنین این الگوریتم قادر به تشخیص صفحات فریب آمیز (اسپم) است.

در بخش نمایه ساز متن خالص از اسناد فارسی مانند HTML ،DOC و PDF بارگذاری شده، توسط خزشگر استخراج شده و با توجه به خصوصیات زبان فارسی نرمال سازی شده و سپس عمل نمایه سازی انجام می‌گیرد.

در این بخش از یک پردازشگر فارسی برای پردازش کلمات و عبارات فارسی استفاده می‌شود که این پردازشگر قادر است عملیات فاصله گذاری و یکسان سازی کدینگ‌های استفاده شده را انجام دهد. همچنین تصاویر و بقیه اسناد در این بخش پردازش می‌شوند. کل این مجموعه عملیات بر روی یک بستر توزیع شده اجرا می‌شود.

بخش بازیابی و جستجو پارسی‌جو نیز که به صورت برخط عمل می‌کند و با کاربر در ارتباط است، در ابتدا پرس‌ و جو را از کاربر گرفته و پس از پردازش آن، اسناد مرتبط را از بخش نمایه‌ساز بازیابی می‌کند. در نهایت اسناد با استفاده از روش‌های هوشمند رتبه بندی جدید که به صفحات فریب آمیز (اسپم) حساسیت پایینی دارند، رتبه‌بندی شده و به کاربر ارائه می‌شوند.

الگوریتم رتبه بندی ارائه شده بیش از ۵۰ ویژگی سایت‌های فارسی را با هم به صورت هوشمند ترکیب می‌کند تا نتایج ارائه شده مورد رضایت کاربران باشد. این الگوریتم نوین توسط تیم پارسی‌جو طراحی و ارائه شده است. همچنین پردازشگر پرس‌وجوی این بخش قادر است عملیات فاصله گذاری، یکسان سازی کدینگ‌ها، ریخت شناسی صرفی و خطایابی را انجام دهد.
خدمات پارسی جو
این موتور جستجو با پوشش ۱۲۰ میلیون صفحه فارسی، در حال سرویس‌دهی به بیش از ۲۰ هزار کاربر فارسی‌زبان در روز است و خدماتی از قبیل وب، تصویر، اسناد علمی، ترجمه ماشینی و دانلود را ارایه می‌دهد.
جستجوی وب از جمله خدمات این موتور جستجو است. این خدمت در بین ۲۰۰ میلیون صفحه فارسی جستجو می‌کند. با توجه به اینکه صفحات وب از طریق گذرگاه رسمی شبکه کشور دریافت شده‌اند، دارای محتویات امن و مطمئن هستند. به‌زودی نسخه جدیدی از پارسی‌جو به بهره‌برداری می‌رسد که امکان جستجو در بیش از ۳۰۰ میلیون صفحه وب فارسی و در زمانی بسیار کوتاه‌تر را فراهم می‌سازد و در ضمن کیفیت صفحات انتخابی نیز از نظر ارزش اطلاعاتی و رتبه‌بندی بهبود قابل توجهی یافته است.
جستجوی تصویر این موتور در بین ۴۰ میلیون تصویر صورت می‌گیرد. این تصاویر عمدتا از صفحات وب فارسی استخراج شده‌اند و همانند جستجوی وب، سرویس جستجوی تصویر نیز تا حد امکان دارای محتویات امن و مطمئن است.
در بخش جستجوی اسناد علمی نیز این موتور قادر به جستجو در بین یک میلیون مقاله انگلیسی و فارسی است.

ترجمه ماشینی نیز از دیگر خدمات پارسی جو است. این سرویس قابلیت ترجمه ۲ زبانه متن از فارسی به انگلیسی، انگلیسی به فارسی و فینگلیش به فارسی به همراه فرهنگ لغت انگلیسی به فارسی را دارد. نسخه آزمایشی این سرویس به صورت روزانه در حال بهبود و بروزرسانی است.

خدمت ترجمه مبتنی بر روش ترجمه ماشینی هوشمند آماری عمل کرده و از ترجمه ماشینی که توسط دانشگاه صنعتی امیرکبیر پیاد‌سازی شده است، استفاده می‌کند.

نسخه موبایل پارسی‌جو نیز به بهره‌برداری رسیده است و تمام سرویس‌های فوق به راحتی با استفاده از گوشی‌های هوشمند تلفن همراه در دسترس است.

برچسب ها :

ناموجود
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰
  • نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
  • نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.