داده کاوی ( تحلیل هوشمند اطلاعات )

آیا تا به حال فکر کردید که این همه دیتا که داریم در کسب و کارمان جمع می کنیم، به چه دردی می خورند؟ خیلی از دیتاها وقتی که زمان استفاده از آنها تمام می شود، فقط برای روز مبادا در هارد دیسک ها یا DVDها ذخیره می شوند، ولی معمولا هیچ وقت دیگر از آنها استفاده نمی شود.

واقعا اطلاعات انبارگردانی فروشگاه که در طی یک سال مالی قبل جمع آوری شده به چه کاری می آید؟

آیا تا به حال فکر کردید که اطلاعات مراجعین به یک کتابخانه یا اطلاعات بانکی سال های گذشته و یا اطلاعات خط تولید یک کارخانه بعداز گذشت چند ماه یا چند سال به چه دردی می خورند؟

هوشمندسازی , هوشمند , نرم افزار , سازمان , ساختمان , خانه , اداره , صنعت , صنایع , هوش مصنوعی , هوشیار , هوشمندی , استارتاپ , استارت آپ , سمینار , وبینار , کارگاه , محصول , کسب کار , bi , bms , ربات , رباتیک , سیستم , مدارس , یکپارچه

اطلاعات چیست؟

اشتباه نکنید منظورم از اطلاعات، فقط اطلاعات اصلی یک کسب و کار نیست بلکه اطلاعات اصلی و جانبی، با هم، مورد توجه این مقاله هستند. اطلاعاتی مثل اینکه کاربران یک سایت فروشگاهی ، چندبار روی لینک یک محصول کلیک کردند و آن را نخریدند؟ یا اطلاعاتی درباره میزان فشار قلم امضای الکترونیک بر روی پد امضای الکترونیک در باجه های یک بانک.

اینها اطلاعاتی هستند که علاوه بر اطلاعات اصلی یک کسب و کار، میزان تفاوت هوشمندی و موفقیت یک کسب و کار را تعیین میکنند.

خیلی از شرکت های موفق در کشورهای پیشرفته با تحلیل اطلاعات جانبی در کنار اطلاعات اصلی، به دنبال پیشی گرفتن از رقبای خودشان هستند.

در این مقاله با اصطلاح داده کاوی و کاربردهایش آشنا می شویم.

 

داده کاوی چیست؟

داده کاوی علمی است که به دنبال کشف رابطه های پنهان در داخل اطلاعاتی است که به صورت روزانه و لحظه ای در کسب و کارهای مختلف ، جمع آوری می شوند. مثل اطلاعات تصاویر رادیولوژی بیماران که برای کشف الگوهای بیماری ها بسیار مهم هستند.

داده کاوی چه چیزی نیست؟

شاید عنوان این تیتر یک مقدار بی معنی باشد ولی به علت اینکه معمولا داده کاوی با آنالیز(تحلیل داده ها) اشتباه گرفته می شود، لازم است بگوییم که داده کاوی علم تحلیل داده نیست. علم تحلیل داده به دنبال علت و معلول ها و رابطه های مشهود آنها می گردد و معمولا با روش های آماری سنتی (ریاضیاتی) انجام می شود. ولی داده کاوی با روش های نوین هوش مصنوعی به دنبال اطلاعات و رابطه های پنهان آنها می گردد.

 

ابزار داده کاوی چیست؟

برای اینکه بتوانیم داده کاوی را بر روی مجموعه ای از اطلاعات اجرا کنیم، می بایست به اطلاعات سالم و کامل دسترسی داشته باشیم. فرض کنید که می خواهیم از داده کاوی برای کشف الگوی رفتاری مجرمین سابقه دار استفاده کنیم. لازم است تا اطلاعات فردی (شخصی) مثل سن، قد، رنگ چشم، رنگ پوست، عادات غذایی، وزن، بلندی انگشتان دست و … و همچنین اطلاعات اجتماعی مثل میزان تحصیلات، سطح فرهنگ، محل های زندگی، سوابق مجرمانه، علت جرایم و … را در اختیار داشته باشیم تا بتوانیم با پالایش و استخراج اطلاعات مفید از بین آنها، پیش بینی کنیم که میزان احتمال ارتکاب جرایم توسط این فرد چقدر است.

چالش بسیار مهم

ولی در خیلی از پروژه های داده کاوی، اطلاعات موجود یک سازمان برای شروع داده کاوی، اطلاعات کامل و مناسبی نیست. آیا می توان با اطلاعات ناقص و مشکوک داده کاوی صحیحی انجام داد؟

جواب سوال بالا بلی است. با استفاده از بخشی از علم هوش مصنوعی، به نام تمیز کردن دیتا (Data Clining) می توان اطلاعات ناقص را کامل و اطلاعات ناصحیح را به اطلاعات قابل اطمینان تبدیل کرد.

 

هوشمندسازی , هوشمند , نرم افزار , سازمان , ساختمان , خانه , اداره , صنعت , صنایع , هوش مصنوعی , هوشیار , هوشمندی , استارتاپ , استارت آپ , سمینار , وبینار , کارگاه , محصول , کسب کار , bi , bms , ربات , رباتیک , سیستم , مدارس , یکپارچه

پیش مقدمه داده کاوی

قبل از شروع هر کاری در بحث داده کاوی، ابتدا باید مشخص کنیم که هدف از داده کاوی چیست و در صورت انجام صحیح داده کاوی به دنبال به دست آوردن چه نتیجه ای هستیم.

اگر هدف از داده کاوی خیلی واضح و روشن مشخص نشده باشد، نمی توان با روش های داده کاوی نتایج مطلوبی از پیمایش داده ها گرفت.

 

مرحله اول

مرحله اول برای داده کاوی به دو شکل انجام می شود. اولین حالت آن در صورت دداشتن دیتای ناصحیح و ناکامل ، تمیز کردن دیتا است. (که بالاتر توضیح داده شد.)

دومین حالت آن جمع آوری دیتای جدید از طریق پرسشنامه های کاغذی (که در قرن بیستم رو به منسوخ شدن است)، پرسشنامه های آنلاین (که این روش نیز در حال منسوخ شدن است)، اطلاعات نامحسوس کاربران آنلاین (مثل موضوعاتی که کاربر بیشتر کلیلک می کند)، اطلاعات رفتار مالی کاربران، اطلاعات رفتار فیزیکی که با دوربین ها به دست می آید (در فروشگاه های فیزیکی) و…

 

مرحله دوم

بررسی پارامترهای داده کاوی است. روش های داده کاوی براساس چند پارامتر تعریف می شوند و هر پارامتر دارای خروجی متفاوتی است. حتی اگر دیتای اولیه یکسان باشد.

* قواعد انجمنی : در این قواعد به دنبال کشف رابطه اتفاقات مختلف با یکدیگر هستیم. مثلا ارتباط خرید قلم توسط مشتریان به خرید                   کاغذ توسط آنها. در واقع کشف کنیم که چند درصد از مشتریانی که قلم می خرند، کاغذ هم خواهند خرید.

* ترتیب : مشخص می کند که کدام اتفاق بعداز اتفاق فعلی رخ خواهد داد. مثلا در موقع تولد یک نوزاد و خروج او از بیمارستان کنار                     فروشگاه، چند درصد احتمال خرید پوشک توسط چدر نوزاد وجود دارد.

* پیش بینی : پیش بینی اتفاقات پیوسته در هر کسب و کاری را می توان با این قاعده به دست آورد. مثلا پیش بینی قیمت ارز

* رده بندی (طبقه بندی) : برای تعیین طبقه ها یا رده های اطلاعات. با این قاعده می توان اتفاقات گسسته را پیش بینی کرد. مثلا                   پیش بینی فروش یک کالا در شب عید هر سال

* خوشه بندی : گروه بندی اعضای یک مجموعه از اطلاعات با استفاده از این قاعده امکان پذیر است. مثلا مشخص کنیم که کالای کلاه               پشمی در کدام بازه زمانی سال فروش بیشتری دارد.

* مصورسازی : برای تصویرسازی داده های غیر تصویری کاربرد دارد. خیلی از اوقات تصویرسازی داده ها، می تواند دید روشنتری به                     تصمیم گیرندگان یک کسب و کار بدهد. ساده ترین حالت تصویرسازی داده ها، رسم نمودارهای میله است.

 

برخی مشکلات داده کاوی

* اولین دسته بندی دولتی یا خصوصی بودن محیط داده کاوی است که بسیار اهمیت دارد. به دلیل اینکه معمولا مراکز دولتی به راحتی به            اطلاعات خیلی زیاد و خصوصی مردم دسترسی دارند که برای انجام داده کاوی بسیار عالیست. ولی در سازمان ها و صنایع خصوصی              به دست آوردن اطلاعات، آنهم اطلاعات جانبی در کنار اطلاعات اصلی، کار بسیار سخت و اعتمادناپذیری است.

* در مراکز دولتی معمولا می توان به راحتی طی فرم های آنلاین و فیزیکی، اطلاعات لازمه را به دست آورد.

* ولی در مراکز خصوصی، می بایست این اطلاعات را به صورت نامحسوس بدست آورد. البته جمع آوری دیتا باید به شکلی باشد که                  حریم خصوصی افراد، دست نخورده باقی بماند.

* در عوض در مراکز دولتی مردم کمتر اعتماد می کنند. (مخصوصا در کشورهای جهان سوم)

* در ارایه اطلاعات به مراکز خصوصی در صورت داشتن رضایت، اطلاعات را به درستی ارایه می دهند.

* یکی دیگر از مشکلات روشن نبودن وزن ارزشی اطلاعات است که در روش های داده کاوی در صورت عدم دقت مهندس داده کاوی،                  میتواند نتایج داده کاوی را به کلی تغییر دهد.

* ممکن است به دلیل بی دقتی در انتخاب هدف از داده کاوی و یا استفاده از روش ها و قواعد نادرست در داده کاوی، نتایج متفاوت و دور            از انتظاری از داده کاوی به دست آید.

* حفظ حریم خصوصی بالاخص در فضای مجازی یکی از دغدغه های سفارش دهندگان داده کاوی و مهندسین داده کاوی است که باید در            بسیاری از پروژه های دولتی و حتی خصوصی، مورد توجه قرار گیرد.

 

کاربردهای داده کاوی

یکی از کاربردهای مهم داده کاوی برای کشف مدل های جرایم و مجرمین و تامین امنیت جامعه است. که در کشور ما نیز نیروی انتظامی با همکاری سازمان زندان ها و قوه قضاییه در حال انجام تحقیقات اولیه بر روی این امر هستند.

همینطور در برقراری امنیت بهداشتی ، بیمه ، بانکداری و … در سطح عمومی جامعه به خوبی می توان از داده کاوی استفاده نمود.

و برای مراکز خصوصی هم می توان برای بازاریابی هدفمند ، شناخت مخاطبین و سلایق آنها و سایر موارد به خوبی از داده کاوی استفاده نمود.

0 0 رای‌ها
امتیاز به این آموزش
عضو شدن در ...
اطلاع از
guest

این سایت از اکیسمت برای کاهش هرزنامه استفاده می کند. بیاموزید که چگونه اطلاعات دیدگاه های شما پردازش می‌شوند.

9 دیدگاه
Inline Feedbacks
دیدن همه دیدگاه ها