تعداد صفحات:137
نوع فايل:word
فهرست مطالب:
مقدمه
مفاهيم پايه
XML چيست؟
معرفي اجزا اصلي XML
مدل درختي XML
مفهوم شما در XML
انواع زبانهاي كوئري در XML
رابطه XML و پايگاه دادهها
پايگاه دادههاي مبتني بر XML
پايگاه دادههاي پشتيبان XML
مقدمه اي بر نحوه پردازش پرس و جوها
مروري بر كارهاي انجام شده
روش حلقه هاي تودرتو
روش Structural Join
روش StairCase Join
روش Holistic Twig Join
روش TJFast
روش هايي مبتني بر شاخص هاي مسيري
كاستيهاي موجود در روشهاي پردازش كوئري
روش پيشنهادي
طرح مسئله
روش شماره گذاري سند
مدل سه مرحله طرح جدول شاخص
راهنماي پرس وجو
انتخاب شاخص مسيري
نقطه اتصال
تجزيه پرس وجو
مرحله اول) اجراي كوئري بر روي راهنماي تطابق الگو
مرحله دوم) توليد جدول شاخص
مرحله سوم) توليد نتايج نهايي
كاربرد جدول شاخص در كوئري هاي پيچيده
نقاط اتصالي با بيش از دو زير شاخه
كوئري هايي با بيش از دو نقطه اتصال
كوئري هايي با عملگرهاي مختلف
نمايش سمبوليك جدول شاخص
بهينه سازي جدول شاخص از روي شماي سند
ارزيابي روش جدول شاخص
توسعه روش جدول شاخص
كاربرد روش در پاسخ به عملگرهاي نقيض
كاربرد جدول شاخص در پرش از روي گره هاي بي فايده
كاربرد جدول شاخص روي برگ هاي شاخص شده
پياده سازي و ارزيابي
محيط پياده سازي و معيارهاي مقايسه
مقايسه با روش هاي مشابه
نتيجه گيري و كارهاي آينده
نتيجه گيري
كارهاي آينده
منابع
فهرست اشكال و جداول:
ساختار درختي يك سند
يك نمونه TPQ
نمونهاي از يك سند داده
مقايسه دو ليست براي پي بردن به رابطه ما بين گرهها
نحوه شماره گذاري درخت
شبه كد الگوريتم Tree- Merge-Anc
روش شماره گذاري پسوندي و پيشوندي
پيوند پلكاني
روش شماره گذاري در TJFast
يك نمونه FST
نمونهاي از كد گذاري Dewey
روش سه مرحله اي جدول شاخص
يك نمونه نقطه اتصال
يك نمونه جدول شاخص
مراحل حذف پيچيدگي پرس و جوهاي چند شاخه اي
يك نمونه IT_Model
يك نمونه از نقطه استخراج
عملگر AND ميان گرههاي يك نمونه TPQ
يك نمونه عملگر NOT
يك نمونه كوئريي دو شاخه اي Q4
عملگر NOT در كوئريهاي دو شاخه اي
حذف دادهها در كوئري هاي دوشاخهاي با عملگر NOT
تعداد گرههاي خوانده شده
مقدار فضاي برده شده در حافظه اصلي
زمان اجرا
تعداد گرههاي پردازش شده
كوئري هاي تك شاخهاي
كوئري هاي چند شاخهاي
كوئري هايي با عملگر نقيض
مشخصات ديتاستها معروف
مشخصات جدول رندوم ديتاست
اندازه كد گذاري Dewey
كوئري هاي اجرا شده روي IT و TJFast
كوئري هاي اجرا شده روي T2S
چكيده:
امروزه XML به يكي از قالبهاي مهم براي ذخيره و تبادل دادهها تبديل شده است. انعطاف ساختار XML موجب گسترش استفاده از آن گرديده و حجم اسناد XML روز به روز در حال افزايش است. در نتيجه به منظور مديريت اسناد XML نياز به يك سيستم مديريت جامع ميباشد؛ زيرا سيستم مديريت فايلي توانايي مديريت چنين حجمي از دادهها را ندارد. با رشد چشمگير اين پايگاههاي داده نياز به تسريع در عمليات اجراي كوئري ها حس مي شود. بيشتر محققان به اين جنبه XML پرداختهاند و روش هاي زيادي در اين زمينه ارائه شده است. اما از آنجايي كه ساختار XML با ساختار رابطه اي قديمي بسيار متفاوت است، اصولا اين روش ها ناكارآمد هستند و بهصورت يك استاندارد پذيرفته نشدهاند، از اين رو تلاش محققان براي حل اين مشكل دو چندان شده است. تاكنون روشهاي زيادي براي حل اين مشكل در دنياي XML ارائه شدهاند، اما هر روش تنها به جنبهاي از نواقص پرداخته و تنها براي دسته كوچكي از كوئري ها كارايي دارد در نتيجه براي قسمت عمده كوئريها ناكارآمد است. در نتيجه هنوز روش خاصي به عنوان يك استاندارد، مانند SQL در پايگاه دادههاي رابطهاي سنتي، وجود ندارد و ميتوان گفت هنوز استفاده از XML به مرحله بلوغ و بهرهبرداري كامل نرسيده است.
دراين پايان نامه ما به دنبال روشي هستيم كه براي دسته بزرگي از كوئري ها كارآيي لازم را داشته باشد. روشي كه در مقايسه با روشهاي مشابه تعداد گرههاي كمتري را مورد دستيابي قرار داده و در زمان كمتري به پاسخ برسد. روشي كه قابليت تلفيق با شاخص روشهاي مشابه را داشته و بتواند از آنها براي تسريع كوئري ها استفاده نمايد. ما به دنبال روشي هستيم كه قابليت پرش از روي گرههاي بيفايده را داشته باشد و دادههاي مياني كمتري در مقايسه با روشهاي مشابه توليد نمايد. روشي كه با استفاده از يك راهنماي تطابق الگو، به طور مستقيم و كوركورانه به پردازش گرهها در سند نپردازد.