این بار با نرم افزاری تخصصی برای کارشناسان و محققین حوزه داده کاوی در کنار شما هستیم. اگر در این حوزه فعالیت داشته باشید احتمالا برایتان پیش آمده است که برای آزمایش و بررسی نتایج روشهای استخراج قواعد وابستگی به پایگاه داده های ساختگی (مصنوعی) نیاز پیدا کرده باشید. نرم افزاری که پیش روی شماست قادر است متناسب با نیاز شما پایگاه دادههایی تصادفی از نوع تراکنشی (Transactional) ایجاد نماید.
از مشهورترین نرم افزارهای موجود در این زمینه که احتمالا با آن آشنا هستید نرم افزاری است که به شرکت IBM نسبت داده میشود و متأسفانه فاقد رابط کاربری گرافیکی میباشد. به همین دلیل کاربران در استفاده از آن با مشکلاتی روبرو هستند.
نرم افزار تولیدکننده دادههای ساختگی ایران شمیم که با عنوان Iranshamim Synthetic Dataset Generator در اختیار شما قرار گرفته است کاملا کاربرپسند بوده و از طریق یک ویزارد ساده امکان ایجاد پایگاه دادههای تراکنشی را برای کاربر فراهم میآورد.
ویژگیهای نرم افزار تولیدکننده داده های ساختگی ایران شمیم Iranshamim Synthetic Dataset Generator
- رابط کاربری گرافیکی
- امکان تعیین تعداد آیتمهای پایگاه داده و نحوهی فرمتبندی نام آیتمها
- امکان تعیین دستی آیتمهای پایگاه داده
- امکان تعیین تعداد تراکنشهای پایگاه داده
- امکان تعیین میانگین طول تراکنشها (میانگین تعداد آیتمهای موجود در تراکنشها)
- امکان دریافت خروجی پایگاه داده برای نرم افزار مایکروسافت اکسس (در قالب فایل mdb)
- امکان دریافت خروجی متنی پایگاه داده (در قالب فایل TXT، مناسب برای مطالعات علمی و آزمایشی)
- امکان فرمت بندی خروجی متنی
روش کار با نرم افزار
روش کار با این نرم افزار برخلاف برخی نمونههای خارجی بسیار آسان است. پس از نصب و اجرای نرم افزار با یک ویزارد روبرو خواهید شد. این ویزارد، فرایند تولید پایگاه داده را در سه گام ساده دنبال میکند:
گام اول: در گام اول باید لیست آیتم های پایگاه داده را پیکربندی کنید. در این بخش میتوانید از دو روش استفاده کنید:
در روش اول کافی است تعداد آیتم های پایگاه داده و نحوه نامگذاری آنها را مشخص کنید تا نرم افزار به صورت خودکار براساس فرمت تعیین شده توسط شما آیتم های پایگاه داده را مشخص کند. در حالت پیشفرض، آیتمها به صورت I1 و I2 و I3 و … نامگذاری میشوند.
در روش دوم میتوانید به صورت دستی نام آیتم های پایگاه داده را وارد کنید. معمولا از این روش برای ایجاد پایگاه دادههایی با آیتم های سبد خرید استفاده میشود.
گام دوم: در این مرحله باید تعداد تراکنشهای پایگاه داده را مشخص کنید. در صورت تمایل میتوانید با تعیین میانگین طول تراکنشها، تعداد آیتم موجود در تراکنشها را نیز کنترل کنید.
گام سوم: در این گام، خروجی نرم افزار را مشخص میکنید. شما میتوانید پایگاه داده تصادفی را در قالب یک فایل mdb (پایگاه داده مایکروسافت اکسس) یا یک فایل متنی ساده دریافت کنید. اگر گزینهی فایل متنی را انتخاب کنید میتوانید نحوه ذخیره پایگاه داده در فایل متنی را نیز مشخص کنید. در حالت پیش فرض، هر تراکنش میتواند چند خط را در فایل متنی به خود اختصاص دهد (هر آیتم در یک تراکنش در خطی جداگانه قرار میگیرد)، اما با تیک زدن گزینه Use single line for each transaction، هر تراکنش به همراه تمامی آیتم هایش در یک خط قرار میگیرد. به علاوه در این بخش میتوانید کاراکتری برای جداسازی شماره تراکنش و آیتم های موجود در آنها مشخص کنید. به این ترتیب نرم افزار می تواند برای آزمایشات شما پایگاه داده هایی متنی و کاملا انعطافپذیر ایجاد نماید.
با کلیک روی گزینه Generate فرایند تولید پایگاه داده ساختگی آغاز میشود. لازم به ذکر است این فرایند برای خروجی متنی از سرعت بالاتری برخوردار میباشد و به طور کلی به اندازه پایگاه داده مورد نظر نیز بستگی دارد.
پیشنیازها
- سیستم عامل: Microsoft Windows XP and newer
- Microsoft .Net Framework 3.5 sp1
- Windows Installer 3.1
دانلود
دانلود Iranshamim Synthetic Dataset Generator 1.0
حجم فایل: 970 KB
با سلام و احترام
بازه در این نرم افزار چطور تعیین می شود ؟مثلا بازه یک تا صد یا صفر تا یک
اگه امکان تعیین بازه داشته باشه بسیار کاربردی
سلام دوست گرامی.
توجه داشته باشید این نرم افزار برای تولید پایگاه داده های تراکنشی به کار می رود و معمولا در پایگاه داده های تراکنشی این آیتم ها هستند که مهم هستند و هر آیتم یک مشخصه دارد که غالبا با چیزی مثل I1 تا In نمایش داده می شوند. در هر صورت این مشخصه های آیتم ها تفاوتی در خروجی تست ها ندارد و برای هر نوع تستی که نیاز به داده های ساختگی تراکنشی داشته باشد مناسب خواهد بود.
با اینحال اگر بازه مدنظر شما بین 1 تا n (مثلا 100) باشد می توانید در گام اول، مقدار 100 را در بخش Items Count وارد کنید و فیلد Item-Names format را خالی بگذارید تا نام گذاری آیتم ها به صورت 1 تا 100 انجام شود.