در سالهای اخیر، با توسعه ابزار محاسباتی رایانهها و امکان دستیابی به نتایج حاصل از محاسبات سخت و پیچیده در مدت زمان کوتاه، موجب شده است تا الگوریتمهای پیشرفته ریاضی مورد توجه قرار بگیرند. این الگوریتمها با درنظرگرفتن ابعاد مختلف داده، به پالایش و تحلیل آن پرداخته و الگوهای پیچیده و غیرقابل تشخیص توسط روشهای سنتی را استخراج و ارائه میکنند. رایانهها کمک کردهاند تا فرآیند استخراج،پالایش، پیشپردازش و مدلسازی دادهها و همچنین اعتبارسنجی یافتهها با دقت و سرعتی بالاتر انجام شود.
داده کاوی یک مرحله ضروری در فرآیند کشف دانش در پایگاههای داده (KDD) است که الگوها یا مدلهای مفیدی از دادهها را تولید میکند. شرایط KDD و داده کاوی متفاوت است. KDD به فرآیند کلی کشف دانش مفید از دادهها اشاره دارد و به کشف الگوهای جدید از انبوهی از دادهها در پایگاههای داده با تمرکز بر الگوریتمهایی برای استخراج دانش مفید اشاره دارد.
فرآیند داده کاوی
- فرآیند کشف دانش در پایگاههای دادهKDD Knowledge Discovery in Databases از روشهای توالی تکرار شونده به شرح زیر تشکیل شده است:
- انتخاب: انتخاب دادههای مربوط به کار تجزیه و تحلیل از پایگاه داده
- پیش پردازش: حذف دادههای اضافی و متناقض؛ ترکیب چندین منبع داده
- تبدیل: تبدیل دادهها به اشکال مناسب برای انجام دادهکاوی
- دادهکاوی: انتخاب الگوریتم دادهکاوی متناسب با الگوی دادهها؛ استخراج الگوهای داده
- تفسیر/ارزیابی: تفسیر الگوها به دانش با حذف الگوهای زائد یا نامربوط؛ ترجمه الگوهای مفید به عباراتی که برای انسان قابل درک باشد
کاربردهای داده کاوی
شش عملکرد اصلی دادهکاوی عبارت است از:
- طبقهبندی: یافتن مدلهایی که یک آیتم داده را به چندین کلاس از پیش تعریف شده تجزیه و تحلیل و طبقه بندی میکند
- خوشهبندی: شناسایی مجموعه محدودی از دستهها یا خوشهها برای توصیف دادهها
- رگرسیون: نگاشت یک آیتم داده به یک متغیر پیشبینی با ارزش واقعی
- مدل سازی وابستگی (آموزش قواعد انجمنی): یافتن مدلی که وابستگی های مهم بین متغیرها را توصیف میکند.
- تشخیص انحراف (تشخیص غیراستانداردها و غیرنرمالها): کشف مهمترین تغییرات در دادهها
- خلاصه سازی: یافتن یک توصیف فشرده برای زیر مجموعهای از دادهها
اهداف داده کاوی
دادهکاوی دو هدف اصلی پیش بینی و توصیف دارد. پیشبینی شامل استفاده از برخی متغیرها در مجموعه دادهها به منظور پیشبینی مقادیر ناشناخته سایر متغیرهای مرتبط است (مانند طبقهبندی، رگرسیون، و تشخیص ناهنجاری).
مفاهیم مختلفی از مدیریت دانش وجود دارد. در این مقاله از تعریف مدیریت دانش توسط مک اینرنی (2002) استفاده میکنیم: «مدیریت دانش (KM) تلاشی برای افزایش دانش مفید در سازمان است. راههای انجام این کار شامل تشویق ارتباطات، ارائه فرصتهایی برای یادگیری، و ترویج اشتراکگذاری مصنوعات دانش مناسب است.» این تعریف بر جنبه تعاملی مدیریت دانش و یادگیری سازمانی تأکید دارد. فرآیند مدیریت دانش بر جریانهای دانش و فرآیند ایجاد، اشتراک و توزیع دانش متمرکز است. هر یک از واحدهای دانش جذب و ایجاد، به اشتراکگذاری و انتشار، و کسب و کاربرد را میتوان با فناوری اطلاعات تسهیل کرد.
از آنجایی که فناوریها نقش مهمی در مدیریت دانش بازی میکنند، فناوریها ابزار ضروری برای استفاده از KM هستند. بنابراین، KM به فناوریهایی برای تسهیل ارتباطات، همکاری و محتوا برای جذب، اشتراک، انتشار و کاربرد بهتر دانش نیاز دارد.
این بخش یک نمای کلی از طبقهبندی فناوریهای KM به عنوان ابزار ارائه میدهد و بر ابزارهایی برای جذب و ایجاد دانش تمرکز دارد. لیائو (2003) فناوریهای KM را با استفاده از هفت دسته طبقه بندی میکند:
- چارچوب KM
- سیستمهای مبتنی بر دانش (KBS)
- دادهکاوی
- فنآوری اطلاعات و ارتباطات
- هوش مصنوعی (AI) / سیستمهای خبره (ES)
- فناوری پایگاه داده (DT)
- مدلسازی
کاربرد داده کاوی در مدیریت دانش
راگلز و همکاران (1997) فناوریهای KM را به عنوان ابزارهایی که دانش تولید میکنند (به عنوان مثال داده کاوی)، دانش کد و انتقال دانش دستهبندی میکند. دالکیر (2005) ابزارهای KM را بر اساس فاز چرخه KM طبقهبندی میکند. میتوانیم مشاهده کنیم که دادهکاوی بخشی از مرحله خلق و ضبط دانش را شامل میشود.
در این مطالعه، منابع دانش بررسی و به هشت گروه تقسیم شده است و ارتباط آن با دادهکاوی مشخص شده است:
سازمان بهداشت و درمان
این حیطه استفاده از مطالعه موردی سیستم مدیریت دانش بیماری (KMS) بیمارستان بود. ابزار دادهکاوی برای کشف بیماریها، عملیات و روابط تومورها استفاده شد. این ابزار برای ساخت KMS برای حمایت از پزشکی بالینی به منظور بهبود کیفیت درمان استفاده می شود. (عملکرد مناسب دادهکاوی: طبقهبندی، خوشهبندی، وابستگی و مدلسازی)
خرده فروشی
این دانش مشتری مربوط به مشتریان خانگی برای مسائل خط تولید و گسترش نام تجاری بود. دادهکاوی میتواند به شرکت کمک کند و پیشنهادات و راهحلهایی را برای توسعه خط تولید و برند ارائه دهد. این فعالیت با استخراج دانش بازار از مشتریان، برندها، محصولات و دادههای خرید برای شناسایی و ثبت رفتار و خواستههای مشتریان انجام میشود. (عملکرد مناسب دادهکاوی: وابستگی، مدلسازی و خوشهبندی)
مالی/بانکی
دانش حوزه دادههای مالی و اقتصادی را پوشش میدهد. دادهکاوی میتواند به مؤسسات بانکی کمک کند تا فرآیندهای پشتیبانی تصمیم و اشتراک دانش را در طبقهبندی اوراق مشارکت سازمانی انجام دهند. (عملکرد مناسب دادهکاوی: طبقهبندی و خوشهبندی)
کسب و کارهای کوچک و متوسط (شرکت مواد غذایی و زنجیره تامین مواد غذایی)
انواع دانش در کسب و کارهای کوچک و متوسط مانند شرکت مواد غذایی در قالب درخت دانش برای یافتن روابط به روش تعامل انسان و کامپیوتر و بهینه سازی فرآیند تصمیم گیری تقسیمبندی شده است. لی و همکاران برای حل مشکلات شبکههای زنجیره تامین مواد غذایی. (2010) نمونه اولیه EW&PC را ایجاد کردند که از اجزای اصلی تشکیل شده است: پایگاه دانش، طبقهبندی کار و رویکردهای الگو، کتابخانه روشهای DM با سیستم خبره یاب برای انتخاب روش بهینه، کاوشگر و پیشبینیکننده، و رابط کاربر. این سیستم مدلهای پشتیبانی تصمیم را ساخت و به مدیران کمک کرد تا تصمیم گیری را انجام دهند. (عملکرد مناسب دادهکاوی: طبقهبندی)
علم کارآفرینی
منبع دانش کارآفرینی، داراییهای تحقیقاتی در یک موسسه دانشی است. سه نوع از داراییهای تحقیقاتی وجود دارد: محصولات تحقیقاتی، سرمایه فکری و برنامههای تحقیقاتی. دادهکاوی استخراج دانش را تسهیل کرد و به مدیران در تعیین استراتژیهای رقابت سازمانی دانشمحور کمک کرد. (عملکرد مناسب دادهکاوی: طبقهبندی)
کسب و کار
دادههای جمع آوری شده از پرسشنامه، بررسی ادبیات فشرده، و بحث با چهار متخصص KM. داده کاوی می تواند الگوهای پنهان بین KM و عملکرد آن را برای اجرای بهتر KM کشف کند (عملکرد مناسب دادهکاوی: طبقهبندی)
همکاری و کار تیمی
گزارش و اسناد کارگر، رفتار ارجاع هر کارگر مورد تجزیه و تحلیل قرار گرفت و جریان دانش کارگر را ساخت. تکنیکهای دادهکاوی میتوانند نمونه اولیه جریانهای دانش مبتنی بر گروه (GKF) را برای گروههای مبتنی بر وظیفه استخراج و بسازند. (عملکرد مناسب دادهکاوی: خوشهبندی)
صنعت ساخت و ساز
بخش بزرگی از این اطلاعات سازمانی در قالب فرمتهای داده متنی در دسترس بود. این منجر به نفوذ تکنیکهای متن کاوی برای مدیریت منبع اطلاعات متنی برای کشف دانش صنعتی و راه حلهای مدیریت میشود. (عملکرد مناسب دادهکاوی: خوشهبندی، وابستگی و مدلسازی)
تکنیکها و کاربردهای مورد استفاده دادهکاوی در مدیریت دانش
طبقه بندی
طبقهبندی یکی از رایج ترین یادگیریها در دادهکاوی است. هدف این کار نگاشت یک آیتم داده در یکی از چندین کلاس از پیش تعریف شده است.
نمونههایی از روشهای طبقهبندی مورد استفاده به عنوان بخشی از مدیریت دانش شامل طبقهبندی بیماران از مراکز مراقبتهای بهداشتی اولیه به متخصصان است. این نمونه ترکیبی از رویکردهای دادهکاوی و پشتیبانی تصمیم در برنامهریزی سیستم مراقبت بهداشتی منطقهای است.
در شرکت مالی، چنگ، لو و شو (2009) یک رویکرد مبتنی بر هستیشناسی از KM و اشتراک دانش در سیستم مدیریت دانش مالی (FKMS) را پیادهسازی کردند و از طبقهبندیکننده ترکیبی SOFM/LVQ تکنیکهای دادهکاوی خوشهبندی و طبقهبندی برای طبقهبندی شرکتها استفاده کردند.
برای مشاغل کوچک و متوسط: حوزه شرکت مواد غذایی، داده کاوی میتواند تصمیمگیری را با روش پرورش دانش یعنی Extenics و Extension Data Mining (EDM) بهبود بخشد. این روش ادغام داده کاوی و مدیریت دانش است و برای توسعه یک پلت فرم سیستم پشتیبانی تصمیم برای تصمیم گیریهای مناسب بود.
از آنجایی که دارایی های دانش نقش مهمی در اقتصادهای دانشی ایفا میکرد، کانتو و سبالوس (2010) از فاکتور دادهکاوی برای استخراج الگوهای مفید جهت کمک به تصمیم گیرندگان در ایجاد حفظ و بهبود داراییهای دانش استفاده کردند و از یک پلت فرم شبکه اطلاعات دانش (KIN) برای مدیریت دانش استفاده کردند.
خوشه بندی
این شامل جستجو برای شناسایی مجموعه محدودی از مقولهها و گروهبندی اشیایی است که مشابه یکدیگر و غیر مشابه با اشیاء متعلق به دیگر خوشهها هستند. این تکنیک در بسیاری از زمینه ها استفاده شده است، به عنوان مثال:
مراقبت های بهداشتی:
دسته بندی خوشه بندی ویژگیهای مورد استفاده در تجزیه و تحلیل شباهتهای بین مراکز بهداشتی جامعه
خرده فروشی:
خوشه بندی برای خط محصول احتمالی و گسترش نام تجاری برای شناسایی خوشههای بازار به مشتری
مالی/بانکی:
شناسایی گروههای خوشه اوراق قرضه شرکتی با توجه به صنعت و یک بخش خاص در یک صنعت؛ سپس دادههای خوشه ای را برای هر صنعت به عنوان الگویی برای پیشبینی تغییرات رتبه بندی تنظیم میکند.
صنعت ساخت و ساز:
خوشه بندی دادههای متنی برای کشف گروههایی از الگوهای دسترسی مشابه
همکاری و کار گروهی:
شناسایی گروههایی از کارکنان با نیازهای اطلاعاتی مرتبط با وظایف مشابه بر اساس شباهتهای جریان دانش آنان
ابزارهای رایج مورد استفاده برای خوشه بندی شامل k-means، تجزیه و تحلیل مؤلفه های اصلی، آزمون کولموگروف-اسمیرنوف و آزمون محدوده و ترتیب قطبی است. خوشهبندی کی-میانگین: روشی در کمیسازی بردارهاست که در اصل از پردازش سیگنال گرفته شده و برای آنالیز خوشهبندی در دادهکاوی محبوب است. کی-میانگین خوشهبندی با هدف تجزیه مشاهدات به خوشه است که در آن هر یک از مشاهدات متعلق به خوشهها با نزدیکترین میانگین آن است، این میانگین به عنوان پیشنمونه استفاده میشود. این به پارتیشنبندی دادههای به یک دیاگرام ورونوی تبدیل میشود.
مدلسازی وابستگی
اینتکنیک به یافتن مدلی میپردازد که روابط معنیدار بین مجموعههای ویژگی را توصیف میکند. به عنوان مثال، به طور گسترده در مراقبت های بهداشتی برای توسعه دستورالعمل های مسیر بالینی و ارائه یک پلت فرم پزشکی مبتنی بر شواهد استفاده می شود.
در مدیریت مدارک پزشکی، برای تصمیم گیری بالینی مفید است. از طریق استفاده از این تکنیک در مجموعه دادههای صنعت ساخت و ساز، می تواند نتایج بهتری در پالایش دانش داشته باشد. این تکنیک برای استخراج دانش از مشتریان خانگی استفاده می شود. ابزارهای رایج برای مدلسازی وابستگی، قوانین ارتباط Apriori و تحلیل الگوی متوالی هستند. همانطور که در بالا می بینیم، می بینیم که تکنیک ها و کاربردهای دادهکاوی در ادبیات راه حل های متفاوتی را برای مسائل مختلف KM در عمل نشان می دهد.
نتیجهگیری
در سازمان، دانش یک منبع مهم است. مدیریت منابع دانش به یک تقاضای قوی برای توسعه تبدیل شده است. کشف دانش مفید نیز رویکرد مهمی برای مدیریت و تصمیم گیری دارد. از آنجایی که دادهکاوی بخش اصلی KM است، این مطالعه ده مقاله مرتبط با کاربردهای داده کاوی در KM را شناسایی کرده است که بین سال های 2007 و 2019 منتشر شده است. نتایج ارائه شده در این مقاله دارای چند فرض است:
- بر اساس نرخ انتشار، تحقیقات در مورد کاربرد دادهکاوی در KM در آینده افزایش خواهد یافت و علاقه در زمینههای مختلف را پوشش می دهد.
- طبقه بندی وظایف دادهکاوی معمولاً مدلی است که در سازمان برای توصیف و پیش بینی استفاده می شود. با این حال، تکنیکهای هیبریداسیون را خواهیم دید، به عنوان مثال. قانون انجمن و خوشه بندی؛ طبقهبندی و خوشهبندی و غیره به منظور حل مسائل مختلف KM ر ا میتوان در نظر گرفت. این روند در آینده افزایش خواهد یافت.
- در زمینه مراقبتهای بهداشتی، یک مقاله از تکنیک تجسم به عنوان مکملی برای سایر وظایف دادهکاوی استفاده کرد. این سیستم تجسم میتواند عملکرد بهتری را در تصمیمگیری بهبود بخشد و منجر شود.
- KM یک حوزه تحقیقاتی بین رشتهای است. بنابراین، در آینده، توسعه مدیریت دانش ممکن است نیاز به ادغام با فنآوریهای مختلف داشته باشد و متدولوژیهای بیشتری برای حل مشکلات مدیریت دانش نیاز داشته باشد.
- توسعه برنامههای کاربردی KM تمایل دارد از تصمیمگیری متخصص پشتیبانی کند و کاربرد یک دامنه مشکل خواهد بود.
در این مقاله، بیان شد که دادهکاوی را میتوان در چارچوب KM ادغام کرد و فرآیند KM را با دانش بهتر افزایش داد. واضح است که تکنیکهای دادهکاوی تأثیر عمدهای بر عملکرد KM خواهند داشت و چالشهای مهمی را برای تحقیقات مدیریت دانش و سیستمهای اطلاعاتی آینده ایجاد خواهند کرد.