در مسير وب معنايی/ بخش اول
در ادامه نوشته قبلی ( من برای وب رويايی دارم: وب معنايی) در اين مطلب سعی می كنيم كمی بيشتر با جزئيات وب در مفهوم معنايی آن آشنا شويم.
وب معنايی بدون شك شامل يك ساختار بسيار پيچيده برای توليدكنندگان و يك ساختار كاملا آسان برای كاربران خواهد بود. به اين مفهوم كه برای قدرتمند شدن و ثروتمند ماندن در چنين وبی نمی توان خيلی روی كمپانی های كوچك اميد بست. در وب جديد، تنها ايده ها خلاق برای رشد سريع كافی نيست و هر سرمايه گذاری برای موفقيت نيازمند بكار گيری متخصصان در حوزه های مختلف نيز می باشد.
هر چند هنوز چهره وب معنايی يك چهره غبار گرفته است ولی بسياری معتقندند كه هوش مصنوعی (AI) يك مولفه اساسی در چنين ساختاری خواهد بود، در حالی كه برخی ادعا می كنند كه وب معنايی بيشتر در حوزه معناشناسی گسترش خواهد يافت و البته عده ای نيز تلاش می كنند تا وب معنايی را محيطی نشان دهند كه در آن ديتا و محتويات وب كاملا حاشيه نويسی شده و برچسب های هوشمند قابليت تفسير مفاهيم را امكان پذير خواهند كرد. اگرچه به نظر ميرسد سخن هر سه گروه سخنی درست باشد ولی بايد منتظر ماند و تماشا كرد
همانطور كه در مطلب قبلی اشاره شد، مبنای بيان تفكر وب معنايی ايجاد ساختاری بود كه در آن ماشين ها بتوانند مانند انسان ها محتويات وب را پردازش كرده و در مفهوم عام ماشين ها نيز مانند انسان بتوانند انچه رو مرور كرده اند را بفهمند. راهكار چنين ايده ای، ايجاد متاديتا ایاست كه ديتا را برای ماشين ها تشريح كند تا بدين طريق كامپيوتر ها قادر شوند معنای آنچه را مررو می كنند را نيز بفهمند. در واقع چيزی شبيه عمل برچسب نويسی كنونی (Tag) اما بسيار تكامل يافته و بر مبانی استاندارد هايی كه هم برای انسان ها و هم برای ماشين ها يكسان باشد.
برای چنين منظوری شما بايد برای تمامی محتويات وب يك شرح بنويسيد و آن ها را ضمن طبقه بندی مناسب بنوعی قابل تفسير كنيد. برای مثال وقتی كه درون يك متن از كتابی صحبت ميشود بايد آن محتوا طوری حاشيه نويسی شده باشد كه اطلاعات پايه مانند نام نويسنده ، تعداد صفحات و اطلاعات نشر آن نيز موجود و قابل فهم باشد ضمن اينكه آن مطلب نيز در دسته موضوعی كتاب طبقه بندی شده باشد
RDF ، OWL و راهكار رياضيات برای حاشيه نويسی
هم اكنون ميليارد ها صفحه وب غير استاندارد روی وب وجود دارد كه شامل هيچ نوعی از حاشيه نويسی يا متاديتا ای كه محتوا را شرح دهد، نمی باشند. سوال اساسی اين است كه چگونه و با چه روشی می توان فرم بی ساختار كنونی را ترك كرد و به سمت وبی رفت كه تمامی محتوای آن از تكست گرفته تا ويدئو و محتوای ديجيتال چنين ساختارمند شده باشند.
هم اكنون كنسرسيوم جهانی وب(w3) به استفاده از دو روش برای حل اين موضوع فكر می كند RDF (Resource Description Framework) و OWL (Web Ontology Languages) روش هايی هستند كه متخصصين اميدوارند تا با تكامل آنها و تبديلشان به استاندارد های جهانی و با كمك گرفتن از فرمول های رياضی ماشين ها را چنان توانمند سازند تا هستی شناسی مفاهيم وب و نوع ارتباط مفاهيم با يكديگر و نيز با ديگر مفاهيم را درك كنند.
RDF يك زبان مبتنی بر XML است كه امكان شرح نويسی و تعريف نوع ارتباط مفاهيم را از طريق گزاره جملات ممكن می سازد. در واقع RDF می تواند ساختار يك جمله را تحليل كرده و از نظر زبان شناسی، فاعل ، مغعول و گزاره ای كه در آن اشاره شده را برای ماشين تفكيك نمايد.مثلا جمله ای مانند The sky has the color blue در زبان RDF در سه فرمت قالب بندی ميشوند The sky با قالب subject و has the color با قالب predicate و blue با قالب object.
OWL زبان ديگری مبتنی بر زبان XML است كه هدف آن تشريح ذات و تعريف هستی شناسانه يك مفهوم خواهد بود. به بيان ساده هدف OWL آسان سازی معانی يك مفهوم است. مثلا اينكه كامپيوتر بداند سگ يك حيوان است و يا اينكه سگ چهارپا دارد. هم اكنون سه نسخه متفاوت برای OWL وجود دارد: Lite ، DL و Full كه هركدام از اين ها به شكل متفاوتی به تحصيل تكنيك های بيانگری ديتا و محلسبه پذير بودن می پردازند.
فريم ورك های RDF و OWL بسيار جامع هستند اما فهم آنها برای كسانی كه پس زمينه مطالعاتی قوی در علوم كامپيوتر و رياضيات نداشته باشند، دشوار خواهد بود.
بهر حال اگر اين دو تكنيك بتوانند به مرحله از موفقيت برسند كه خروجی آن اطلاعات هوشمندی باشد كه برای ماشين قابليت فهم داشته باشد ، بايد منتظر مكانيسم هايی باشيم كه به طور خودكار ساختار بی نظم كنونی را دريافت كرده و در خروجی آن يك ساختار كد نويسی شده و نظم يافته قابل فهم ارائه گردد.










