E-ISSN: 2676-6159 | P-ISSN: 2538-5079 |
|
|
Journalof DecisionsandOperationsResearch |
|
|
www.journal-dmor.ir |
|
|
J. Decis. Oper. Res. Vol. 9, No. 4 (2024) 1064–1086. |
|
Paper Type: Original-Application Paper |
|
|
Automatic |
|
Scientific |
|
Documents |
|
Clustering Technology |
|
Based |
|
on |
|
Water |
|
Cycle Algorithm |
|
|
Majid Abdolrazzagh-Nezhad1,* |
|
, Bahare Hashemzadeh2, Efat Ghasemi3 |
|
1 Department of Computer Science, Faculty of Computer and Industrial Engineering, Birjand University of Technology, |
|
Birjand, Iran; abdolrazzagh@birajndut.ac.ir. 2 Department of Computer Engineering, Al-Zahra University, Mashhad, Iran; hashemzadeh_b67@yahoo.com. |
|
3 Department of Computer Engineering, Birajnd Branch, Islamic Azad University, Birjand, Iran; ef.ghasemi@gmail.com. |
|
Citation: |
|
|
Abdolrazzagh-Nezhad, M.,Hashemzadeh, B.,& Ghasemi, Gh. (2024).Automaticscientificdocuments |
|
clustering technology based on water cycle algorithm. Journal of decisions and operations research, 9(4), |
|
1064-1086. |
|
|
Received: 10/06/2024 |
|
Reviewed: 18/08/2024 |
|
Revised: 21/10/2024 |
|
Accepted: 05/11/2024 |
|
Abstract |
|
|
Purpose: The clustering of large-scale textual data plays a key role in the easy browsing and scrolling of huge documents by organizing their structures. One of its applications is scientific document clustering, which was presented or published in conferences and journals to categorize articles with common topics. The research's purpose is to improve the quality and speed of scientific document clustering and reduce the need for manual parameter settings. |
|
Methodology: The paper proposes a novel automatic scientific documents clustering method based on the Water Cycle Algorithm (WCA). The proposed method consists of different stages of pre-processing, scientific document representation based on TF-IDF adapted for scientific documents, defining the mechanism of activating and deactivating cluster centers from a certain number of cluster centers in order to create flexibility in the number of scientific document clusters and the WCA to optimize the number of cluster centers and their coordinates. |
|
Findings: In this paper, two benchmark datasets, NIPS 2015 and AAAI 2013, are used, which contain information on articles presented at two conferences. Also, the automatic clustering has been implemented based on four meta-heuristic algorithms: Differential Evolution Algorithm, Genetic Algorithm, Artificial Bee Colony Algorithm and Particle Swarm Optimization. Davis-Bodelin index and Chu and Su index were utilized to evaluate the quality of the obtained results. The comparison of the obtainedresultsshows that the proposed method has better quality and efficiency inscientific document clustering and is able to overcome the challenges of unbalanced and large textual data clustering. |
|
Originality/Value: In the proposed automatic clustering method, the WCA has been used for the first time. With regard to scientific articles in the same field are presented in a journal or conference, and statistical analysis has a special place to identify keywordsof these documentsintheirclusteringquickly,TF-IDF andthe mechanismof activation anddeactivation of cluster centers have been combined in the proposed scientific documents clustering. |
|
Keywords: Text mining, Automatic scientific documents clustering, TF-IDF, Meta-heuristics, Water cycle algorithm. |
|
Corresponding Author: abdolrazzagh@birajndut.ac.ir https://doi.org/10.22105/dmor.2025.487980.1888 Licensee. Journal of Decisions and Operations Research. This article is an open access article distributed under the terms and conditions of the Creative Commons Attribution (CC BY) license (http://creativecommons.org/licenses/by/4.0). |
تایلمع رد قیقحت و یریگمیمصت |
|
1064-1086 ،)1403( ،)4( هرامش ،9 هرود |
|
www.journal-dmor.ir |
|
یدربراک-یشهوژپ:هلاقمعون |
|
بآهخرچمتیروگلا یانبمرب یملعدانساراکدوخ یدنبهشوخ یژولونکت |
|
یمساقتفع، هدازمشاههراهب،*،1داژنقازرلادبع دیجم |
|
.ناریا ،دنجریب ،دنجریب یتعنص هاگشناد ،عیانص و رتویپماک یسدنهم هدکشناد ،رتویپماک مولع هورگ1 |
|
.ناریا ،دهشم ،)س( ارهزلا هاگشناد ،رتویپماک یسدنهم هورگ2 |
|
.ناریا ،دنجریب ،یملاسا دازآ هاگشناد ،دنجریب دحاو ،رتویپماک یسدنهم هورگ3 |
|
هدیکچ |
|
یاهتیلباق زا یکی .دراد نوتم زا یهوبنا ناسآ رورم شیامیپ رد یدیلک شقن ،ینتم گرزب یاههرکیپ یهدنامزاس اب نوتم یدنبهشوخ :فده |
|
باختنا و وجوتسج رد یدا یز یاهدربراک هک دشابیم کرتشم تاعوضوم اب تلااقم یدنبهتسد یارب ،یملع یاهسنارفنک رد نوتم یدنبهشوخ |
|
دادعت راکدوخ صیخشت رب دیکات اب ،تسا یشهوژپ تلااقم هژیوهب یملع نوتم یدنبهشوخ تعرس و تیفیک دوبهب ،قیقحت نیا فده .دراد تلااقم |
|
.اهرتماراپ یتسد تامیظنت هب زاین شهاک و اههشوخ |
|
هدیا .دوشیم هیارا )WCA( بآ هخرچ مت یروگلا ساسا رب دیدج یملع دانسا راکدوخ یدنبهشوخ شور کی ،هلاقم نیا رد :شهوژپ یسانششور |
|
و لاعف مزیناکم ف یرعت ،یملع دانسا یارب هدش راگزاس TF-IDFساسا رب یملع دانسا شیامن ،شزادرپشیپ فلتخم لحارم زا لکشتم یداهنشیپ |
|
روظنمهب بآ هخرچ مت یروگلا و یملع دانسا یاههشوخ دادعت رد فاطعنا داجیا روظنمهب هشوخ زکرم ینیعم دادعت زا اههشوخ زکارم ندش لاعفریغ |
|
.دشابیم اهنآ تاصتخم و هشوخ زکارم دادعت یبایهنیهب |
|
هزوح رد سنارفنک ود هب هدشهیارا تلااقم تاعلاطا یواح هک AAAI 2013 و NIPS 2015 درادناتسا هداد هعومجم ود زا هلاقم نیا رد :اههتفای |
|
،یلضافت لماکت یراکتبا ارف مت یروگلا راهچ ساسا رب راکدوخ یدنبهشوخ نینچمه .تسا هدش هدافتسا ،دنتسه یعونصم شوه و نیشام یریگدای |
|
صخاش و )DB( نیلدوب س یوید صخاش زا .دناهدش یزاسهدایپ هدشدای درادناتسا یاههداد یور رب زین تارذ ماحدزا یزاسهنیهب ولسعروبنز ،کیتنژ |
|
ریاس اب هسیاقم رد یداهنشیپ شور هک دهدیم ناشن لصاح جیاتن .تسا هدش هدافتسا هدمآتسدهب جیاتن تیفیک یبا یزرا تهج )CS( وس و وچ |
|
و نزاوتمان ینتم یاههداد یدنبهشوخ یاهشلاچ رب هبلغ هب رداق و هتشاد یملع دانسا یدنبهشوخ رد یرتهب ییاراک و تیفیک ،یراکتبا ارف یاهشور |
|
.تسا سایقم گرزب |
|
نگمهان یاههداد اب یراگزاس ییاناوت هکبآ هخرچ مت یروگلا زاراب نیلوا یارب یداهنشیپ راکدوخ یدنبهشوخشور رد :یملع هدوزفاشزرا/تلاصا |
|
تادنتسم نیا یدنبهشوخ رد و هدشهیارا سنارفنک ای هلجم کی رد هنیمز مه یملع تلااقم هکنیا هب هجوت اب .تسا هدش هدافتسا دراد ار نزاوتمان و |
|
دنیآرف رد هشوخ زکارم ندش لاعفریغ و لاعف مزیناکم و TF-IDF بیکرت ،دراد یاهژیو هاگیاج یدیلک تاملک ع یرس ییاسانش رد یرامآ لیلحت |
|
.تسا هدش هیارا یملع دانسا یدنبهشوخ |
|
.بآ هخرچ مت یروگلا ،یراکتبا ارف یاهمت یروگلا ،TF-IDF ،یملع نوتم راکدوخ یدنبهشوخ ،یواک نتم :اههژاودیلک |
|
همدقم -1 |
|
یاهرازبا یحارط موزل هک هدش هداد فلتخم عاونا زا و لااب مجح اب هداد یاههاگیاپ داجیا ثعاب هداد یزاسهریخذ و دیلوت یاهرازبا نوزفازور شرتسگ |
|
یهجوت لباق شخب یعقاو یایند رد یفرط زا .تسا هتخاس سوملم رتشیب هداد عون اب بسانتم ار اهنآ نورد تاعلاطا فشک و هداد شزادرپ بسانم |
|
بو تاحفص ،اهلیمیا ،اهباتک ،تلااقم ،یربخ تلااقم لاثم( دانسا زا یگرزب هعومجم لماش هک دنشابیم نتم تروصهب سرتسد لباق یاههداد زا |
|
رب یواکهداد ،اههداد نرود زا تاعلاطا فشک و هداد شزادرپ بسانم یاهرازبا هعسوت روظنمهب اذل .دناهدش هریخذ فلتخم عبانم رد هک دنتسه )... و |
|
065 |
|
نابز شزادرپ و یواک نتم زین نآ دربراکرپ رایسب یاههخاش زا یکی هک هتفایهعسوت هداد هاگیاپ و نیشام یریگدای ،یعونصم شوه ،رامآ مولع ساسا |
|
.[1]تسا یعیبط |
|
درکیور کی هک اههداد 3یدنبهشوخ و 2تراظناب درکیور کی هک اههداد 1یدنبهقبط هداد نرود شناد و تاعلاطا فشک یاهرازبا زا هدمع هورگ ود |
|
.)دوش هعجارم [2]هب رتشیب تای یزج زا علاطا روظنمهب( دنهدیم لیکشت دنتسه 4تراظن نودب |
|
دراد هراشا توافت /تهابش یاهرایعم زا یخرب ساسا رب فلتخم هورگ K هب دانسا زا هعومجم کی راکدوخ یدنبمیسقت هب :[4] ،[3]دانسا یدنبهشوخ |
|
یهدنامزاس رد هژیوهب ،یاهدرتسگ یاهدربراک نوتم و دانسا یدنبهشوخ .تسا هورگ نامه رد دانسا ریاس هباشم ،هورگ کی رد دنس ره هک یروطهب |
|
زا کرد داجیا روظنمهب نوتم یدنبهشوخ مهم رایسب شقن رب تللاد عونتم یاهدربراک نیا .دراد راتخاس نودب ینتم یاههداد زا یگرزب یاههعومجم |
|
یاهدربراک زا یخرب هب همادا رد .دراد فلتخم یاههنیمز رد یریگمیمصت یاهدنیآرف هب کمک و دنمشزرا شنیب هیارا ،ینتم یاههداد زا یدایز مجح |
|
.تسا هدش هراشا دانسا یدنبهشوخ یدیلک |
|
.[6]،[5]دنکیم کمک تاعلاطا رتدمآراک و رتعیرس یبایزاب هب یدنبهشوخ ،هباشم دانسا یدنبهورگ اب :5تاعلاطا یبایزاب |
|
.1 |
|
تسادیفم یلصاتاعوضوم کرد وندرک هصلاخ یارب هک دنک ییاسانش نتم زا یگرزب هعومجم رد ار تاعوضوم راکدوخ روطهب دناوتیم :6عوضوم جارختسا |
|
.2 |
|
.[8] ،[7] |
|
|
لیلحتوهیزجت ای یدنبهقبط دننام ،نتم لیلحتوهیزجت فیاظو ریاس یارب شزادرپشیپ هلحرم کی ناونعهب دناوتیم دانسا یدنبهشوخ :7اههداد شزادرپشیپ |
|
.3 |
|
.[10] ،[9]دنک لمع تاساسحا |
|
|
.[12]،[11]دنک کمک ینوناق یاهمایپ زا همانزره صیخشت هب همانزره یواح نوتم کرتشم یاهیگژیو ییاسانش اب دناوتیم :8همانزره ندرک رتلیف |
|
.4 |
|
خساپ و لیلحتوهیزجت یارب اهیدنبهتسد رد یرتشم یاهدروخزاب و تارظن یدنبهورگ یارب ناوتیم دانسا یدنبهشوخ زا :9یرتشم دروخزاب لیلحتوهیزجت |
|
.5 |
|
.[14] ،[13]درک هدافتسا رتهب |
|
|
زا اهدنور و یمومع راکفا کرد یارب ،اهتسپ ای اهتیئوت دننام ،یعامتجا یاههناسر یاوتحم لیلحتوهیزجت یارب :10یعامتجا یاههناسر لیلحتوهیزجت |
|
.6 |
|
.[16] ،[15]دوشیم هدافتسا نوتم یدنبهشوخ |
|
|
یاهشوخ یاوتحم اب ربراک یاهتساوخرد هیلوا هسیاقم اب ار وجوتسج یاهروتوم ییاراک دناوتیم نوتم یدنبهشوخ :11وجوتسج یاهروتوم یزاسهنیهب |
|
.7 |
|
.[18] ،[17]دشخب دوبهب هناگادج دانسا یاجهب |
|
|
یدنبتیولوا و تیریدم و هدرک کمک اهلیمیا یهدنامزاس هب رگیدکی اب هباشم یاهمایپ یدنبهورگ اب نوتم یدنبهشوخ یاهمتیروگلا :12لیمیا تیریدم |
|
.8 |
|
.[20] ،[19]دنکیم رتناسآ ار تاطابترا |
|
|
ات دنکیم کمک اههاگداد و یقوقح یاهتکرش هب و دوشیم هدافتسا یقوقح دانسا یزاسبترم یارب دانسا یدنبهشوخ :13یقوقح دانسا لیلحتوهیزجت |
|
.9 |
|
.[22] ،[21]دننک تیریدم یرترثؤم روطهب ار هدنورپ هب طوبرم تاعلاطا |
|
|
رایتخا رد ار بسانم یاوتحم و دشخب دوبهب ار رگهیصوت یاهمتسیس ات درک یدنبهورگ عوضوم ساسا رب ناوتیم ار یربخ تلااقم :14رابخا یروآعمج |
|
.10 |
|
.[24] ،[23]دهد رارق ناگدنناوخ |
|
|
و تایبدا یسررب عیرست و دوبهب روظنمهب عوضوم ساسا رب ار یملع تلااقم دنناوتیم یملع دانسا یدنبهشوخ کمک هب ناققحم :15کیمداکآ تاقیقحت |
|
.11 |
|
و بلقت و یرارکت یملع یاوتحم صیخشت عیرست ،نیققحم هب هدنهدداهنشیپ یاهمتسیس یحارط هب کمک .[26] ،[25]دننک یدنبهتسد یتاقیقحت نامزاس |
|
|
.دنتسه یملع دانسا یدنبهشوخ یاهدربراک نیرتمهم زا تلااقم وجوتسج یزاسهنیهب رد هدافتسا |
|
|
یدنبهتسد لیذ هورگ هس رد ار اهنآ ناوتیم هک هدشهیارا یفلتخم یاهشور ریخا ههد ود لوط رد دانسا یدنبهشوخ یلااب یدربراک تیمها هب هجوت اب |
|
.دنراد ار دوخ صاخ یاهشلاچ و ایازم کی ره هک ییاهشور .درک |
|
1 Classification 2 Supervised approach 3 Clustering 4 Unsupervised approach 5 Information retrieval 6 Topic extraction 7 Data preprocessing 8 Spam filtering |
|
9 Customer feedback analysis 10 Social media analysis 11 Search engine optimization 12 Email management 13 Legal document analysis 14 News aggregation 15 Academic research |
|
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
1 |
|
1066 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
|
دانسا یدنبهشوخ یتنس یاهشور |
|
و کچوک یاههداد یارب هتبلا ،لااب تعرس و یگداس لیلد هب هک تسا ینتم یاههداد یدنبهشوخ رد دربراکرپ یاهشور زا یکی K-Means متیروگلا |
|
اب یاهشوخ یاهیگژیو باختنا ساسا رب نتم یدنبهشوخ شور کی [27] ناراکمه و وز هلاقم رد .دوشیم هتفرگ راک هب یاهدرتسگ روطهب ،نزاوتم |
|
رد شور نیا .دندرک داهنشیپ نیوانع جارختسا ساسا رب یدنبهشوخ شور کی زین [28]ناراکمهو ام هلاقم رد .دوشیم یسررب K-Meansمتیروگلا |
|
هلاقم رد .تسا هدش هدافتسا یدنبهشوخ یارب K-Means و نیوانع جارختسا رب ینتبم هلکیرید ناهنپ صیصخت لدم زا زین نآ رد و هدش هیارا زاف هس |
|
یدنبهشوخ ماجنا یارب ار یزاف K-Means همین مان هب یدیدج متیروگلا کی و دننکیم زکرمت تراظن همین یدنبهشوخ یور رب [29] |
|
ناراکمه و ویل |
|
وجلاو هلاقم رد .دنهدیم هیاراار اههشوخ ماغدا و میسقت یژتارتسا [30]یش و نوی هلاقم رد .دنریگیم راک هب هدش یراذگتملاع یماسا ناونع اب دنس |
|
و ناج هلاقم رد .دوش دودحم اههشوخ هزادنا دهدیم هزاجا هک دندرک هیارا یتراظن همین یدنبهشوخ یارب دیدج متیروگلا ود [31]ناراکمه و اگنآوه |
|
رد دوبمک رب هبلغ و یرامآ لیلحتوهیزجت یارب اههداد تخاس ،اههشوخ دادعت نییعت لکشم هس لح یارب یدنبهشوخ شور کی [32] ناراکمه |
|
دانسا یاههداد هعومجم یدنبهشوخ یاربIKLCEA1 مان اب هچراپکی K-Means شور [33]ناراکمه و وسکیا هلاقم رد .دش داهنشیپ دنس یدنبهشوخ |
|
اب نزاوتمان یاههداد رد نییاپ درکلمع و ترپ طاقن هب تیساسح ،هیلوا یاههشوخ دادعت هب یگتسباو لیلد هب متیروگلا نیا ،لاح نیا اب .دندرک یفرعم |
|
راتخاس زا و دنراد دربراک اههداد رد طباور لیلحت یارب زین 2یبتارمهلسلس یدنبهشوخ دننام رگید یاهشور .[34]-[36] تسا هجاوم ییاهشلاچ |
|
درکلمع ،اههشوخ هیلوا دادعت باختنا هب دایز تیساسح شلاچ اب اهشور نیا ،دوجو نیا اب .[38] ،[37]دنربیمهرهب اههداد یهدنامزاس یاربیتخرد |
|
وربور دنتسین میجح یاههداد بسانم هک یبتارمهلسلس یاهشور رد ییلااب ینامز یگدیچیپ و دایز زیون اب یاههداد ای نزاوتمان یاههداد رد فیعض |
|
|
.دنتسه |
|
|
قیمع یریگدای یاهشور و ییانعم یاهلدم رب ینتبم یدنبهشوخ |
|
نیا رب هبلغ یارب .دنهد ناشن اقیقد ار دانسا ینعم دنناوتب ات دنریگیمن رظن رد ار تاملک نایم یتخانشانعم طباور ،یتنس یدنبهشوخ یاهمتیروگلا |
|
نتم یدنبهشوخ تیفیک دوبهب یارب هدرتسگ روطهب 3تن درو دننام یسانشیتسه زا ییانعم تاعلاطا یفرعم اب [39] ناراکمه و یو هلاقم رد ،لکشم |
|
کمک تاملک نیب طباور و انعم رتهب مهف هب GloVe و Word2Vec دننام هملک هیبعت یاهکینکت و WordNet ریظن ییاهلدم .دننکیم هدافتسا |
|
هدافتسا ینتم دانسا یدنبهشوخ یارب تندرو یژولوتنآ زا هدافتسا اب ییانعم تهابش و یگیاسمه میهافم زا [43] شناد هلاقم .[42]-[40] دناهدرک |
|
شیامن یارب ینیون شور [44] ولنتخ و یریما .دشابیم شور نیا ندوب دمآراک هدنهدناشن یعقاو یاههداد یور یبرجت جیاتن هک ؛تسا هدرک |
|
ار |
|
Accuracy و F-measure ریداقم یداهنشیپ شور هک دهدیم ناشن جیاتن .تسا هداد هیارا یبتارم هلسلس تروصهب دانسا یموهفم و لاکیژولوتنآ |
|
یتنس یاهشور هب تبسن هدیچیپ یاههداد یدنبهشوخ رداریرتلااب تقد و دنربیم هرهب یدنبهشوخ یارب ییانعم طباور زا اهشور نیا .دهدیم دوبهب |
|
جارختسا ،یاهلمجدنچ تارابع و فدارتم دوجو ،تابساحم یلااب مجح و شزادرپشیپ هب زاین لیلد هب ،لاح نیا اب .دنهدیم هیارا دانسا یدنبهشوخ |
|
|
.دنتسه وربور ییاهشلاچ اب گرزب یاههداد رد هدشدیلوت یاههشوخ یارب بسانم فیصوت فیرعت و نوتم زا هتسه یسانشانعم |
|
زا اهشور نیا .دنوشیم هدافتسا یاهدرتسگ روطهب دانسا یدنبهشوخ رد ،5یتشگزاب و 4یشچیپ یبصع یاههکبش هلمج زا ،قیمع یریگدای یاهشور |
|
رواب یاههکبش لدم ،اهشور نیا هلمج زا .[46] ،[45] دنریگیم هرهب یدنبهشوخ تقد دوبهب یارب هیلادنچ و هدیچیپ یاهیگژیو جارختسا ییاناوت |
|
یشزومآ یاههداد دنمزاین اهلدم نیا اما ؛[47]دنکیمجارختسا اههداد زااریرتینغ یاهیگژیو ،یاهیلادنچیریگدای تیلباقلیلد هب هک تسا 6قیمع |
|
اهنآ جیاتن یگدیچیپ کرد و اهلدم میظنت لکشم و هدوب زیگناربشلاچ دودحم عبانم اب ییاهطیحم رد هژیوهب و دنتسه لااب یتابساحم عبانم و ناوارف |
|
|
.دراد دوجو زین |
|
1 Integrated K-means–laplacian cluster ensemble approach 2 Hierarchical clustering 3 Wordnet 4 Convolutional Neural Networks (CNN) 5 Recursive Neural Networks (RNN) |
|
6 Deep Belief Networks (DBN) |
|
067 |
|
|
تعیبط زا هتفرگماهلا یاهیزاسهنیهب رب ینتبم یاهمتیروگلا |
|
یاهشور هلمج زا لسعروبنز متیروگلا و (PSO)تارذ ماحدزا یزاسهنیهب ،1کیتنژ متیروگلا دننام تعیبط زا هتفرگ ماهلا یزاسهنیهب یاهمتیروگلا |
|
و دنکیم یدنبهشوخ هنیهب روطهب ار اههداد ،بیکرت و شهج ریظن یلماکت میهافم زا هدافتسا اب کیتنژ متیروگلا .دنتسه دانسا یدنبهشوخ یارب نیون |
|
ماجنا ار اههداد یدنبهشوخ ،تارذ یهورگ راتفر یزاسهیبش اب PSO متیروگلا .[48]-[50] دراد ییلااب ییاراک یدعبدنچ و هدیچیپ یاهدربراک رد |
|
اذغ یوجوتسج رد اهروبنز راتفر زا هک لسعروبنز متیروگلا ،اهنیا رانک رد .[51]-[53] دراد یلحم یاههنیهب زا رارف رد ییلااب ییاناوت و دهدیم |
|
زا هدشهتفرگ ماهلا یاهیزاسهنیهب رب ینتبم یاهمتیروگلا .[55] ،[54] دراد ترپ و نزاوتمان یاههداد شزادرپ رد یبوخ ییاراک ،تسا هتفرگ ماهلا |
|
زا ینابیتشیپ و فلتخم یاههداد اب هعجاوم رد یریذپفاطعنا ،هتشاد یلحم یاههنیهب زا رارف و یرسارس یاههنیهب نتفای رد لااب ییاناوت هچرگا تعیبط |
|
اب اهرتماراپ نیا میظنت هوحن هب اهنآ درکلمع یگتسباو و فلتخم یاهرتماراپ میظنت هب زاین لیلد هب زین اهمتیروگلا نیا اما ،دنراد ار راکدوخ یدنبهشوخ |
|
هخرچ یعیبط یاهدنیآرف رب ینتبم نیون متیروگلا کی ،بآ هخرچمتیروگلا .دنتسه وربور یتابساحم یگدیچیپ و دوخ یاهرتماراپ هنیهب میظنت شلاچ |
|
هب تعرسهب ،تارذ رد یناکم تارییغت داجیا اب متیروگلا نیا .[56]دنکیم لمع یبوخ هب یزاسهنیهب لیاسم رد هک تسا یگدنراب و ریخبت لماش بآ |
|
رتهداس راتخاس و اهرتماراپ راکدوخ میظنت لیلد هب WCA ،نینچمه .دراد یلحم یاههنیهب زا رارف رد یبوخ ییاناوت و دباییم تسد بولطم جیاتن |
|
|
.دهدیم ناشن دوخ زا یبسانم درکلمع نگمهان و نزاوتمان یاههداد یدنبهشوخ رد ،رتهدیچیپ یاهشور هب تبسن |
|
|
.دانسا یدنبهشوخ یاهشور یداقتنا لیلحت هسیاقم -1 لودج |
|
|
بآ هخرچ متیروگلا |
|
Table 1- Critical analysis comparison of document clustering methods. ماهلا یاهمتیروگلا و ییانعم یاهلدم یتنس یاهشور |
|
رایعم |
|
|
تعیبط زا هتفرگ |
|
قیمع یریگدای |
|
|
لاب |
|
طسوتم |
|
طسوتم |
|
لاب |
|
یزاسهدایپ یگداس |
|
لاب |
|
لاب |
|
لاب |
|
طسوتم |
|
یدنبهشوخ تقد |
|
لاب |
|
طسوتم |
|
طسوتم |
|
نییاپ |
|
میجح یاههداد رد ییاراک |
|
نییاپ |
|
طسوتم |
|
لاب |
|
نییاپ |
|
یتابساحم عبانم هب زاین |
|
هداس هیلوا میظنت |
|
قیقد میظنت دنمزاین |
|
راوشد |
|
هیلوا میظنت هب ساسح |
|
رتماراپ میظنت تیلباق |
|
لاب |
|
لاب |
|
لاب |
|
نییاپ |
|
نزاوتمان یاههداد رد ییاناوت |
|
لاب |
|
لاب |
|
طسوتم |
|
نییاپ |
|
یلحم هنیهب زا رارف تیلباق |
|
دننام یتنس یاهشور دوشیم هدهاشم هک روطنامه .تسا هدش هیارا هدش رورم دانسا یدنبهشوخ یاهشور لاکینکت و یداقتنالیلحت 1 لودج رد |
|
زا .دنراد ار دوخ صاخ یاهتیدودحم ،میجح یاههداد رد یدمآراکان و ترپ یاههداد هب تیساسح لیلد هب یبتارم هلسلس یدنبهشوخ و K-Means |
|
ماهلا یاهمتیروگلا .دنراد لااب یتابساحم عبانم و یشزومآ گرزب یاههداد هب زاین قیمع یریگدای و ییانعم یاهلدم رب ینتبم یاهشور ،رگید فرط |
|
گرزب یاههداد رد یدودحم ییاراک ،لااب یتابساحم نامز و اهرتماراپ میظنت یگدیچیپ لیلد هب ،لسعروبنز متیروگلا و PSO ریظن تعیبط زا هتفرگ |
|
یاههداد هب نآ تیساسح هک درک نایب دانسا یدنبهشوخ شور کی دوجو مدع ناوتیم ار قیقحت نیا یورشیپ شلاچ رگید ترابع هب ؛دنراد سایقم |
|
لااب یتابساحم عبانم و یشزومآ گرزب یاههداد هب زاین نامزمه ،هدوب K-Means دننام یتنس یاهشور زا رتمک میجح یاههداد رد دمآراکان و ترپ |
|
شلاچ اب تعیبط زا هتفرگ ماهلا یاهمتیروگلا یایازم زا یریگهرهب نمض و دشاب هتشادن قیمع یریگدای و ییانعم یاهلدم رب ینتبم یاهشور دننام |
|
زا یریگهرهب راب نیلوا یارب هدشنایب قیقحت شلاچ ندناسر لقادح هب روظنمهب قیقحت نیا یروآون اذل .دشابن وربور زین اهرتماراپ میظنت یگدیچیپ |
|
هب بآ هخرچ متیروگلا ،رگیدترابعهب ؛دشابیم دانسا یدنبهشوخ رد اههشوخ دادعت یایوپ و راکدوخ باختنا دنیآرف ساسا رب 2بآ هخرچ متیروگلا |
|
گرزب یاههداد و یتابساحم عبانم هب زاین مدع ،لااب ییاراک ،اهرتماراپ راکدوخ میظنت تیلباق ،یگداس هلمج زا ،دوخ درفهبرصحنم یاهیگژیو لیلد |
|
.تسا یملع دانسا راکدوخ یدنبهشوخ یارب بسانم یاهنیزگ ،نزاوتمان و نگمهان یاههداد اب یراگزاس ییاناوت و یشزومآ |
|
1 Genetic Algorithm (GA) |
|
2 Water Cycle Algorithm (WCA) |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
1 |
|
1068 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
سکوه مان هب یلحم یوجوتسج شور کی و بآ هخرچ متیروگلا بیکرت زا یددع یاههداد یدنبهشوخ روظنمهب [57] داژنینیرحب و بیط هلاقمرد |
|
متیروگلا طسوت یددع یاههداد یور رب هشوخ تباث دادعت اب K-Means متیروگلا یزاسهنیهب .دش هدافتسا DB یبایزرا رایعم ساسا رب و 1زویج و |
|
هک دوب یشلات اهنآ زکرم ات هشوخ ره یاضعا یسودیلقا هلصاف هبساحم هلیسوهب نآ درکلمع یبایزرا و 2ذوفن رگلمع طسوت هتفای اقترا بآ هخرچ |
|
متیروگلا طسوت K-Meansمتیروگلا درکلمع دوبهب روظنمهب هباشم یمادقا زین ناشیا [59]ناراکمه و یل .تفرگ ماجنا [58]ناراکمه و وئایک طسوت |
|
LEACHلکتورپینعی یدنبهشوخ یبتارم هلسلسلکتورپ کی یور ربار بآ هخرچ مت یروگلا دربراک [60]ناراکمه و ریهماگ .دنداد ماجنا بآ هخرچ |
|
یدنبهشوخ یاربمتیروگلا نیا زا راب نیلوا یارب هلاقم نیا رد هک دوشیم هدهاشم هدشهیارا یاهراک یسررباب .دندرک هیارا میسیب رگسح یاههکبشرد |
|
زکارم یزاسلاعفریغ و لاعف مزیناکم زا هدافتسا رد WCAرب ینتبم دوجوم یدنبهشوخ یاهشور ریاس اب یدیلک توافت نآ و هدش هدافتسا یملع دانسا |
|
ریاس هکیلاحرد .تسا بسانم رایسب یملع ینتم یاههداد یارب هک تسا نوتم یملع شیامن یارب هتفایقیبطت TF-IDF لدم زا یریگهرهب و هشوخ |
|
هداد قیبطت هد یچیپ ینتم یاههداد یاربار مت یروگلا هلاقم نیا ،دناهدرک هدافتسا ر یواصت ای یددع یاههداد یدنبهشوخ یارب WCAزا اتدمع تاقیقحت |
|
یبا یزرا یاهرایعم ناونعهب CSو DBیاهصخاش زا هدافتسا .تسا هدرک هیارا اههشوخ دادعت راکدوخ باختنا و داعبا شهاک یارب یصاخ تامیظنت و |
|
.دوش ماجنا یرتشیب ماجسنا و تقد اب یملع دانسا یدنبهشوخ ات هدش ثعاب هک تسا یرگید یروآون ،WCAیزاسهنیهب دنیآرف اب اهنآ بیکرت و یفیک |
|
،قیقحت نیا رد هتفرگماجنا دانسا شزادرپشیپ دنیآرف زا لکشتم یملع دانسا راکدوخ یدنبهشوخ تای یزج حیرشت هب مود شخب رد هلاقم نیا همادا رد |
|
.تسا هدش هتخادرپ یدنبهشوخ تیفیک یبایزرا یاهرایعم و دانسا یاههشوخ دادعت یایوپ باختنا ساسا رب یدنبهشوخ دنیآرف ،دانسا شیامن لدم |
|
درکیور یاهرتماراپ میظنت هوحن ،درادناتسا یاههداد هعومجم تایئزجزین مراهچ شخب رد .تسا هدش نایب لیصفت هبموس شخب رد یداهنشیپدرکیور |
|
|
.تسا هدش حرطم مجنپ شخب رد اهداهنشیپ و یریگهجیتن تیاهن رد .تسا هدش هیارا اهنآ لیلحت و هدمآتسدهب جیاتن ،یداهنشیپ |
|
|
یملع دانسا راکدوخ یدنبشوخ -2 |
|
طسوت تسردان یدیلک تاملک تبث لامتحا و اههشوخ هنیهب دادعت یاهشلاچ اب هراومه یدیلک تاملک و اوتحم ساسا رب یملع دانسا یدنبهشوخ |
|
شیامن داجیا،شزادرپشیپلحارملماش و هدشیحارطروکذمیاهشلاچ عفرروظنمهب یملعدانساراکدوخ یدنبهشوخ.دشابیم وربورناگدنسیون |
|
هتخادرپ اهنآ حیرشت هب همادا رد هک دشابیم هدمآتسدهب راکدوخ یاههشوخ تیفیک یبایزرا یاهصخاش و یدنبهشوخ دنیآرف ،یملع دانسا یددع |
|
|
.تسا هدش |
|
|
اههداد شزادرپشیپ -2-1 |
|
فذح ،فقوت هملک فذح دننام شزادرپشیپ لحارم یارجا هب زاین یملع تلااقم نیا هب طوبرم ینتم یاههداد شزادرپ روظنمهب ماگ نیتسخن رد |
|
لحارم رب هولاع نینچمه .دشابیم یبایهشیر و کچوک فورح لیدبت ،هس زا رتمک لوط اب تاملک فذح ،دیفس یاهاضف و دادعا ،صاخ فورح |
|
مه دناهدش جرد تلااقم 95% زا رتشیب و 5% زا رتمک رد هک تاملک ،یدنبهشوخ دنیآرف رب زیون تاملک یراذگریثات زا یریگولج روظنمهب و هدشدای |
|
|
.دنوشیم فذح |
|
|
فقوت هملک فذح |
|
،at ،is ،the دننام دنتسه ... و هفاضا فورح ،یدنوشیپ فورحلماش لاومعم هک دنوشیم هتفگ نابز کی رد اههژاو نیرتجیار هب بلغا فقوت تاملک |
|
رد فقوت تاملک زا یدرادناتسا تسیل چیه .دوشیم فذح دنس زا دریگ رارق فقوت تاملک تسیل رد دنس رد هملک ره رگا .... و more ،on،which |
|
کی لاثم ناونعهب .تسا هدش هدافتسا فقوت تاملک فذح یارب بلتم رازفامرن یاهرازبا زا قیقحت نیا رد اما ؛درادن دوجو یعیبط نابز شزادرپ هنیمز |
|
فقوت تاملک راد طخریز تاملک اجنیا رد .تسا هدش هداد ناشن ریز رد فقوت تاملک فذح زا دعب و فقوت تاملک فذح زا لبق دنس کی رد هلمج |
|
|
.دنتسه |
|
1 Hookes and Jeeves method |
|
2 Percolation operator |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
|
1069 |
|
:یلصا هلمج |
|
Most of the existing clustering algorithms are based on one internal evaluation function. |
|
:فقوت هملک فذح زا سپ |
|
Most existing clustering algorithms based one internal evaluation function . |
|
دیفس یاهاضف و دادعا ،یراذگهطقن مئلاع ،صاخ یاهرتکاراک فذح |
|
رد .تسا ... و ؟،.دننام یراذگهطقن مئلاع ،ابفلا فورح ،یلاخ یاهاضف ،... و $ ،!،@ دننام هژیو یاهرتکاراک فذح لماش شزادرپشیپ مود ماگ |
|
هب دوشیم لیدبت '.' فذح زا دعب هلمج نیاربانب ؛دراد دوجو '.' طقف قوف لاثم |
|
Most existing clustering algorithms based one internal evaluation function |
|
هس اب ربارب ای رتمک لوط اب تاملک فذح |
|
توافتم اهنابز ریاس یارب لوط نیا .دنرادن ینعم چیه یلکروطهب هس زا رتمک لوط اب یتاملک هک دهدیم ناشن یسیلگنا نوتم لیلحتوهیزجت هبرجت |
|
یسیلگنا دانسا یارب 3 زا رتمک لوط اب یتاملک فذح هب مادقا شزادرپشیپ ماگ نیموس رد ور نیا زا .دشابیم 2 یسرافنابز یارب لاثم ناونعهب .تسا |
|
:دوب دهاوخ شزادرپشی پ هلحرم نیا هجیتن ریز هلمج هب و دش دهاوخ برجنم "one" فذح هب قوف لاثم یارب رما نیا لامعا .دوشیم نابز |
|
Most existing clustering algorithms based internal evaluation function |
|
کچوک فورح هب لیدبت |
|
:شزادرپشیپ هلحرم نیا زا دعب هلمج :لاثم ناونعهب .تسا کچوک فورح هب هلاقم رد دوجوم تاملک مامت لیدبت لماش کچوک فورح هب لیدبت |
|
Most existing clustering algorithms based internal evaluation function |
|
یبایهشیر |
|
لاکشا یدنبهورگ یبایهشیر ماجنا لیلد .تسا هملک یاههشیر مان هب اهنآ یکیژولوفروم یساسا لکش هب بویعم تاملک لیدبت دنیآرف یبایهشیر |
|
کمک یملع تلااقم یدنبهشوخ هب دناوتیم هک دنریگ رارق لیلحتوهیزجت دروم متیآ کی ناونعهب دنناوتیم اهنآ هک یروطهب تسا هملک کی سوکعم |
|
.داد دهاوخ هجیتن ار ریز هلمج هب شزادرپشیپ لبق هلحرم یجورخ هلمج یور رب یبایهشیر هلحرم لامعا .دنک |
|
Most exist cluster algorithm base intern evalu function |
|
اههداد شیامن یاهلدم -2-2 |
|
TF ،[61] One-Hot یراذگزمر زا دنترابع هک دنراد دوجو یرادرب بلاق رد ینتم یاههداد ناونعهب یملع دانسا شیامن تهج یفلتخم یاهلدم |
|
یاهلدم و [63]GloVeو Word2Vecدننام3هملک یزاساج یاهلدم ،[62])2سوکعم دنس سناکرف-هملک سناکرف( TF-IDFو )1هملک سناکرف( |
|
.[64]ELMo و BERTدننام 4ینتم یاههیبعت |
|
1 Term frequency 2 Term frequency-inverse document frequency |
|
3 Word embeddings 4 Contextual embeddings |
1070 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
،گرزبیاهرادربدوشیم ثعاب یلو ،دنتسه One-Hotیراذگزمرهژیویاهتیزم درفهبرصحنم رادربکی صاصتخا وناسآ یزاسهدایپوکرد هچرگا |
|
،هملک یزاساج رب ینتبم یاهلدم رد .دربب نیب زا ار شیامن لدم نیا رب ینتبم یاهمتیروگلا تابساحم یدمآراک و هدرک دیلوت هنیمز دقاف و هدنکارپ |
|
کی یارب فلتخم یناعم کیکفت ییاناوت مدع و دایز یتابساحم عبانم هب زاین یلو دنوشیم هداد ناشن تباث یرادربهزادنا اب تاملک نیب ییانعم طباور |
|
جیاتن و فارطا تاملک ساسا رب تاملک یانعم ییاسانش .تسا ینتم یاههداد شیامن لدم نیا یاهشلاچ نیرتمهم زا فلتخم یاههنیمز رد هملک |
|
یهجوتلباق روطهب هظفاح هب یدنمزاین یلو دنتسه ینتم یاههیبعت ینتبم یاهلدم یایازم زا اهخساپ دیلوت دننام یعیبط نابز شزادرپ فیاظو رد رترب |
|
هچرگا TF-IDF و TFیاهلدم .دشاب لااب اهلدم نیا زا هدافتسا هنیزه دوشیم ثعاب هدیچیپیزاسهدایپ و کرد رانک رد لااب یتابساحم تردق و دایز |
|
یاههداد یارب ،هتشاد یبسانم یریذپریسفت و هدرک سکعنم دنس رد ار تاحلاطصا تیمها میقتسم روط یلو دننک تفایرد ار تاملک یانعم دنناوتیمن |
|
زا مادک ره .تسا رتهدرشف یتابساحم رظن زا و رتبسانم یرامآ تیمها اب نوتم یارب ،هتشاد اهلدم ریاس هب تبسن یرتهب یریذپسایقم گرزب ینتم |
|
لباق ،عیرس جیاتن هب هک ییاهراک یارب TF-IDFو TF دننام رتهداس یاهلدم .دنراد ار دوخ هاگیاج رظن دروم فده صاخ یاهزاین هب هتسب اهلدم نیا |
|
یارب ینتم هیبعت و هملک یزاساج دننام رتهدیچیپ یاهلدم هک یلاح رد ،دنتسه یلاع دنراد زاین یدیلک تاملک ییاسانش و یرامآ لیلحت ،ریسفت |
|
تیانع اب و یملع تلااقم راکدوخ یدنبهشوخ ینعی قیقحت نیا هلئسم هب هجوت اب .دنتسه رتبسانم دنراد نابز ییانعم قیمع کرد هب زاین هک ییاهراک |
|
|
.تسا هدش هدافتسا ،دش رکذ هک یایازم هب هجوت اب TF-IDFلدم زا قیقحت نیا رد ،سنارفنک ای هلجم کی رد هنیمز مه تلااقم هیارا هب |
|
|
)TF( هملک سناکرف |
|
صاخ هملک کی عوقو سناکرف اب هفلوم ره نآ رد هک تسا یعقاو یاهرادرب مرف رد یش ره ای و ینتم دانسا نداد ناشن یارب ییامنزاب عون کی لدم نیا |
|
دنس ود رگا لاثم ناونعهب .دوشیم هدید d دنس رد tهملک هک تسا یتاعفد دادعت رگنایامن 푡푓푡,푑 لدم نیا رد .دراد تقباطم دنس رد )هملک نزو ناونعهب( |
|
|
:دشاب ریز نوتم لماش |
|
Doc1: sara proposed a new meta-heuristic algorithm. Her co-author modified the proposed algorithm. |
|
Doc2: the modified algorithm is more efficient |
|
|
:دوشیم داجیا)'.' و فقوت تاملکیانثتساهب(تسا دنس ود تاملکهمهزا یتسیللماش هک تاملکسیرتامهبلیدبت نتم شزادرپشیپهلحرمزادعب |
|
>modified, efficient ،co-author ،algorithm ،meta-heuristic ،proposed ،Sara> |
|
|
|
:دوشیم هداد شیامن ریز تروصهب دنس رادرب ره نونکا |
|
|
퐷표푐1: |
|
< |
|
1; 2; 1; 2; 1; 1; 0 |
|
> |
|
, |
|
퐷표푐2: |
|
< |
|
0; 0; 0; 1; 0; 1; 1 |
|
> |
|
|
TF-IDFلدم |
|
ره هب نزو صاصتخا زا سپ .تسا رادرب یاضف لدم موهفم زا هدافتسا اب دنس کی رد تاملک یهد نزو یارب هدشهتخانش حرط کی TF-IDF تفج |
|
|
:دوش هداد ناشن لیذ تروصهب دناوتیم 푑 دنس زا TF-IDFتاملک رادرب ،هملک |
|
|
푇퐹 − 퐼퐷퐹푑 = [푤1푑,푤2푑,푤3푑,………,푤푛푑], |
|
)1( |
|
|
1 + |퐷| 푤 = 푡푓 × (1 + 푙표푔 ), 1 + 푑 ∈ 퐷|푡 ∈ 푑 |
|
)2( |
|
.دشابیم ،دنتسه tهملک یواح هک ییاهدنس دادعت {푑′ ∈ 퐷|푡 ∈ 푑′}و دانسالک دادعت |퐷|؛تسا هدش لامرنمرفرد 푑 دنس رد 푡 هملک سناکرف푡푓푡,푑 هک |
|
“clustering”هملک دیریگب رظن ردار هملک 200 یواح دنس کی لاثم ناونعهب .تسا هدش هفاضا رفصربمیسقت یاطخ زایریگشیپیاربمه کی ددع |
|
هملک و تسا دوجوم )D( دنس 500 هک دینکضرفنونکا .تسا 푡푓푐푙푢푠푡푒푟푖푛푔 = 14⁄200 = 0.07 اب ربارب هملک نیا سناکرف .دوشیم رهاظ نآ رد راب 14 |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
|
1071 |
|
:تسا |
|
رادقم |
|
ود |
|
نیا برض |
|
TF-IDF |
|
نزو |
|
،نیاربانب |
|
؛퐼퐷퐹 = 1 + 푙표푔(501/151) = 1.52 |
|
سپ |
|
.دوشیم |
|
رهاظ |
|
دنس |
|
150 |
|
رد |
|
“clustering” |
|
.دومن هبساحم ار تاملک TF-IDF نزو رادرب ناوتیم لبق لاثم یاهدنس رادرب رد ،هباشم روطهب . 0.07 |
|
× |
|
1.52 |
|
= |
|
0.106 |
|
modified, efficient ،co-author ،algorithm ،meta-heuristic ،proposed ،Sara> |
|
|
푡푓 표푐1 = 〈8 ; 8 ; 8 ; 8 ; 8 ; 8 ; 8〉 → 푇퐹 − 퐼퐷퐹 표푐1 = 〈0.147; 0.294; 0.147; 0.25; 0.147; 0.125; 0〉. |
|
|
0 0 0 1 0 1 1 푡푓 표푐2 = 〈4; 4; 4; 4; 4; 4;4〉 → 푇퐹 − 퐼퐷퐹 표푐2 = 〈0; 0; 0; 0.25; 0; 0.25;0.294〉. |
|
|
|
راکدوخ یدنبهشوخ دنیآرف -2-3 |
|
دیلوت یددع رادرب کی TF-IDFشیامن لدم ساسا رب دنس ره یارب،یملع دانسا مامت یور شزادرپشی پ لحارم ماجنا زا دعب دشهراشا هک روطنامه |
|
.تشاد دهاوخ دوجو یدنبهشوخ تهج )دانسا هیلک یدیلک تاملک دادعت( 푛푘푒푦푤표푟푑푠 دعب اب یددع رادرب 푁 دادعت ،دنس 푁 دوجو ضرفاب .دشدهاوخ |
|
نیا TF-IDF .دشاب هدش رارکت دنس 450 هعومجم نیب زا هملک 7000 یواح یلمع دانسا کی رد اهنت و رابکی “efficient” هملک دیریگب رظن رد |
|
رادقم شهاک( دنس 푁 یددع یاهرادرب داعبا شهاک روظنمهب اذل .دوب دهاوخ رفص دانسا ریاس یارب و 0.00048 ربارب روکذم دنس یارب هملک |
|
.دنوشیم فذح دنس 푁 یددع یاهرادرب هیلک زا دنشاب 0.001 زا رتمک اهنآ TF-IDFرادقم نیرتگرزب هک یدیلک تاملک زا هتسد نآ ،) 푛푘푒푦푤표푟푑푠 |
|
لقادح ساسا رب دیاب اهدربراک ریاس یارب و هدش باختنا هملک 2500 لقادح اب یملع تلااقم یور رب ققحت نیا زکرمت هب هجوت اب هناتسآ دح نیا |
|
راکدوخ یدنبهشوخ متیروگلا دنیآرف ،همدقم نیا هب هجوت اب .دوش نییعت دانسا زا ینیعم مجح نیب زا دنس کی رد هملک کی لوبق لباق رارکت دادعت |
|
|
:دوشیم نایب لیذ حرش هب یملع دانسا |
|
.دینک یهدرادقم ار )훼( هشوخ کی ندش لاعف هناتسآ دح و )푘( نکمم یاههشوخ دادعت رثکادح -1 ماگ |
|
نیب رد 푛푘푒푦푤표푟푑푠 ات 1 یاهنوتس ریداقم هک دینک دیلوت یفداصت تروصهب یاهنوگهب ار نوتس 푛푘푒푦푤표푟푑푠 + 1 و رطس 푘 زا لکشتم 퐴 سیرتام -2 ماگ |
|
.دنشاب کی و رفص نیب 푛푘푒푦푤표푟푑푠 + 1 نوتس ریداقم و دانسا یاهرادرب یاهTF-IDFریداقم رثکادح و لقادح |
|
|
زکرم |
|
لاعف هناتسآ |
|
|
|
اههشوخ |
|
یزاس |
|
|
6.1 |
|
3.2 |
|
2.1 |
|
0.3 |
|
|
6 |
|
4.4 |
|
7 |
|
0.6 |
|
|
6 |
|
5.3 |
|
4.2 |
|
0.8 |
|
|
5 |
|
8 |
|
4.6 |
|
0.1 |
|
|
8 |
|
4 |
|
4 |
|
0.9 |
|
|
.훂 = ퟎ.ퟓ بسحرب اههشوخ زکارم ندرک لاعف ریغ و لاعف -1 لکش |
|
|
Figure 1- Activating and deactivating cluster centers according to 훂 = ퟎ.ퟓ. |
|
|
ریداقم و دیریگب رظن رد )1 لکش دننام( لاعف هشوخ زکرم ناونعهب ار تسا 훼 زا رتگرزب اهنآ 푛푘푒푦푤표푟푑푠 + 1 نوتس رادقم هک ییاهرطس هیلک -3 ماگ |
|
.دینک یپک 푖 = 1,…,푘′ ≤ 푘 هک 훺푖 رد ار 푛푘푒푦푤표푟푑푠 ات 1 هفلوم |
|
.دینک هبساحم لیذ هطبار ساسا رب اه 훺푖 ات 푗 = 1,…,푁 یارب دنس 푋푗 = (푥푗1,…,푥푗,푛푘푒푦푤표푟푑푠) هلصاف -4 ماگ |
|
푋 − 훺 = √ 푥 − 휔 2 + 푥 − 휔 2 + ⋯+ (푥 − 휔 )2 . 푘푒푦푤표푟푑푠 푘푒푦푤표푟푑푠 |
|
)3( |
1072 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
|
.دشاب رتکیدزن نآ هب هک تسا لاعف هشوخ زکرم 푘′ زا هشوخ زکرم کی هب اهنت دنس ره -5 ماگ |
|
|
푋푗 ∈ 퐶푟 ∶ 푖푓 ‖푋푗 − 훺푟‖ = 푚푖푛′‖푋푗 − 훺푖‖. |
|
)4( |
|
|
یدنبهشوخ تیفیک یبایزرا یاهصخاش -2-4 |
|
یاههشوخ دادعت یگنیهب شجنس ناکما ،دزاسیم مهارف ار هداد یدنبهتسد نیرتهب یبایزرا ناکما رب هولاع یدنبهشوخ تیفیک یبایزرا یاهصخاش |
|
|
.دشاب یدنبمیسقت هبنج ود لماش دیاب ربتعم صخاش کی ،لآ هدیا تلاح رد .دیامنیم داجیا زین ار هدش هتفرگلکش |
|
یزاسهدرشف ای و ماجسنا هدنهدناشن هشوخ کی رد اههداد عیزوت سنایراو .دنشاب کیدزن رگیدکی هب ناکما دح ات دیاب هشوخ کی رد اههداد :1ماجسنا |
|
|
.تسا هشوخ |
|
.تسا اههشوخ ییادج هدنهدناشن )اهنآ یسدیلقا یهلصاف تسا نکمم( یاهشوخ زکارم نایم هلصاف .دنوشادج یبوخهب دیاب اههشوخ :2یزاسادج |
|
1979 یاهلاس رد بیترت هب هک )CS( وس و وچ و )DB( نیدلوب سیوید صخاش ود زا هدمآتسدهب یاههشوخ تیفیک یبایزرا روظنمهب قیقحت نیا رد |
|
ناشن صخاش ود نیا رتمک ریداقم .دندرگیم حیرشت همادا رد هک هدش هدافتسا ،[65]دناهدش هیارا راکدوخ یاهیدنبهشوخ یبایزرا روظنمهب 2004 و |
|
|
.دراد یدنبهشوخ رتلااب تیفیک هجیتن رد و هدش داجیا راکدوخ یاههشوخ رتشیب زیامت زا |
|
|
)DB( نیدلوب سیوید صخاش |
|
.دوشیم ف یرعت ،تسا (푑푖푗)هشوخ ود نیب تهابش مدع و (푆푖)هشوخ کی یگدنکارپ ساسا رب هک (푅푖푗)هشوخ ود نیب تهابش ساسا رب صخاش نیا |
|
،)푅푖푗 = 푅푗푖( ندوب نراقتم ،)푅푖푗 ≥ 0( هدوب یفنمان نوچمه یطیارش یتس یاب یلو درک ف یرعت یفلتخم یاهتروص هب ناوتیمار هشوخ ود نیب تهابش |
|
푅푖푗 > 푅푖푘 هاگنآ 푑푖푗 < 푑푖푘 و 푆푗 = 푆푘 رگا و 푅푖푗 > 푅푖푘 هاگنآ 푑푖푗 = 푑푖푘 و 푆푗 > 푆푖 رگا ،دشاب رفص ربارب زین 푅푖푗 هاگنآ دنشاب رفص ربارب ودره푆푗 و 푆푖 رگا |
|
|
:دوشیم فیرعت ریز تروص هب هشوخ ود نیب تهابش لاومعم .دشاب اراد ار |
|
|
푆 + 푆 푅푖푗 = , 푖푗 |
|
:دنوشیم هبساحم ریز طباور زا |
|
)5( |
|
|
|
|
|
|
|
|
|
|
푆푖 و 푑푖푗 نآ رد هک |
|
|
푑푖푗 = 푑(푣푖,푣푗). )6( 푆푖 = ‖푐 ‖∑푑(푥,푣푖). )7( 푥∈푐푖 :دوشیم ف یرعت ر یز تروصهب نیدلوب س یوید صخاش هشوخ ود ن یب تهابش ف یرعت و هدشنایب بلاطم هب هجوت اب |
|
|
푛 퐷퐵 = 1 ∑푅푖, 푐 푖=1 |
|
)8( |
|
|
|
|
|
|
:دوشی م هبساحم ر یز تروصهب نآ رد 푅푖 هک |
|
|
푅 = 푚푎푥 (푅 ),푖 = 1…푛 . 푗=1…푛푐,푖≠푗 |
|
)9( |
|
|
)CS( ای Chou and Suصخاش |
|
1 Cohesion |
|
2 Separation |
|
073 |
|
.دندروآ تسد هب هشوخ یاهرادرب نیگنایم هبساحم اب هشوخ کی زکرم رادرب تسخن CS صخاش هبساحم یارب [51]ناراکمه و وچ |
|
ریز لکش هب ار CS صخاش و هتفرگ رظن رد 푑(⃗푥푖,⃗푥푗) |
|
푚⃗푖 = 푁 ∑⃗푥푗, )10( 푥푗∈푐푖 لکش هب ⃗푥푗 و ⃗푥푖 هداد ود نیب هلصاف رایعم .تسا 퐶푖 هشوخ نیما 푖 لخاد یاههداد دادعت 푁푖 هک |
|
:دندرک فیرعت |
|
퐾 ∑푖=1 [ ∑푥⃗푖∈푐푖 푚푎푥{푑(푥⃗푖,푥⃗푞)}] 퐶푆(퐾) = ∑퐾 [ 푚푖푛 {푑(푚 ,푚⃗⃗⃗ )}] 푗∈퐾,푗≠푖 |
|
)11( |
|
∑푖=1 [ 1 ∑푥⃗푖∈푐 푚푎푥{푑(푥⃗푖,푥⃗푞)}] = 푞∈푐푖 . ∑퐾 [ 푚푖푛 {푑(푚 ,푚⃗⃗⃗ )}] 푗∈퐾,푗≠푖 |
|
یداهنشیپ درکیور -3 |
|
متیروگلا کی متیروگلا نیا .دباییم دوبهب و هعسوت 1بآ هخرچ یراکتبا ارف متیروگلا ساسا رب یملع دانسا یدنبهشوخ درکلمع قیقحت نیا رد |
|
یگدنکارپ و مجح عونت یاراد هک ناراب شزیر و ربا لیکشت ،سونایقا زا بآ ریخبت دننام تعیبط رد بآ هخرچ زا هک تسا روحم تیعمج یزاسهنیهب |
|
هنیهب هب ندیسر رد یدایز تعرس نینچمه و یلحم هنیهب زا رارفتیلباقمتیروگلا نیا .تسا هدش هتفرگ ماهلا هناخدور لیکشت و هدوب تعیبطهرتسگ رد |
|
푛푘푒푦푤표푟푑푠 + و رطس 푘 زا لکشتم سیرتام کی قیقحت نیا رد هک دوشیم هدیمان هرطق هوقلاب باوج کی ناونعهب تیعمج وضع ره .[56]دراد یرسارس |
|
یاههبتر یاراد هک تارطق زا یصخشم دادعت نآ زا دعب و ایرد ،دشاب نیرتهب نآ زا هدمآتسدهب راکدوخ یدنبهشوخ تیفیک هک یاهرطق و هدوب نوتس 1 |
|
همادا رد نآ لحارم زا کی ره و هدمآ 2 لکش رد یداهنشیپ شور تراچولف .دش دنهاوخ باختنا هناخدور ناونعهب دنشاب تیفیکاب یدنبهشوخ یدعب |
|
.دنوشیم حیرشت |
|
اهرتماراپ هب هیلوا یهدرادقم و هیلوا تیعمج داجیا -3-1 |
|
و هشوخ زکرم کی ندش لاعف هناتسآ دح 훼 و نکمم یاههشوخ دادعت رثکادح k رتماراپ ود اب دانسا راکدوخ یدنبهشوخ دنیآرفلماش یداهنشیپ شور |
|
ات نایرج هلصاف نازیم هک C ،بآ هخرچ ایرد کی هولاعب هناخدور دادعت 푁푠푟 ،متیروگلا تیعمج ناونعهب هرطق 푛푝표푝 لماش هک بآ هخرچ متیروگلا |
|
کی و رفص نیب کچوک یددع هک 휇 ،هدرک صخشم ار تارطق ریخبت نازیم هک ریخبت رتماراپ 푑푚푎푥 و هدوب 2 ات 1 نیب یددع و هداد ناشن ار هناخدور |
|
.دیامنیم نییعت ار بآ هخرچ یزاسهنیهب متیروگلا یاهرارکت دادعت رثکادح هک 푀푎푥푖푡푒푟 و هدرک لرتنک ار ایرد یکیدزن رد یوجوتسج نازیم تسا |
|
2 ماگ تاحیضوت ساسا رب هک دسریم متیروگلا هیلوا تیعمج ناونعهب ))12( هلداعم( هرطق 푛푝표푝 دیلوت هب تبون هدشدای یاهرتماراپ نییعت زا دعب |
|
دیلوت یفداصت تروصهب ))13( هلداعم( 푘 |
|
× |
|
(푛푘푒푦푤표푟푑푠 + 1) داعبا رد مادک ره هرطق 푛푝표푝 دادعت هب )3-2 شخبریز( راکدوخ یدنبهشوخ دنیآرف |
|
.دنوشیم |
|
1 Water Cycle Algorithm (WCA) |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
1 |
|
1074 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
|
خ |
|
دوب هناخدور زا رتهب ینایرج رگا |
|
|
|
|
|
ی |
|
|
|
|
|
دوب ایرد زا رتهب هناخدور رگا |
|
خ |
|
|
.یداهنشیپ شور تراچولف -2 لکش |
|
|
|
Figure 2- The flowchart of the proposed method. |
|
،WCAیاهرتماراپ هب هیلوا یهدرادقم و k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
دانسا یددع رادرب هلصاف هبساحم هرطق ره لاعف یاههشوخ زکرا م ات )3 هلداعم( |
|
|
|
|
|
|
|
|
|
ره یرا ب لاعف یاههشوخ زکارم نییعت )1 لکش( هرطق |
|
|
|
|
|
|
|
|
یاهصخاش CS و DB هبساحم |
زا یکی هبدنس ره قلعت نییعت ساسرا ب لاعف یاههشوخ زکارم )4 هلداعم( هلصاف نیرتکیدزن |
|
راکدوخ یدنبهشوخ تیفیک یبایزرا هرطق ره یرا ب هدمآ تسدب |
|
|
|
)11 و 8 تلاداعم( |
|
|
|
و اههناخدور ،اهنایرج ندرک صخشم ایرد |
|
|
|
|
|
|
|
|
تانایرج دادعت ندرک صخشم |
اهنایرج یرا ب CS و DB هبساحم دیدج یاههناخدور و )11 و 8 تلاداعم( |
|
و هناخدور ره یرا ب هتفای صیصخت اههناخدور و اهنایرج تیعقوم دوبهب هب هتفای صیصخت یاههناخدور دادعت )17 و 16 تلاداعم( |
|
|
|
15هلداعم طسوت ایرد |
|
|
|
هناخدور اب رتهب نایرج ندش اجباج |
|
|
|
|
ایرد اب رتهب هناخدور ندش اجباج |
|
|
|
|
)20 و 19 تلاداعم( شراب و ریخبت دنیآرف |
|
|
|
|
075 |
|
푃표푝푢푙푎푡푖표푛 표푓 푟푎푖푛푑푟표푝푠 = |
|
푅푎푖푛푑푟표푝1 푅푎푖푛푑푟표푝2 푅푎푖푛푑푟표푝3 ⋮ 푅푎푖푛푑푟표푝푛푝표푝 |
|
. |
|
)12( |
|
푅푎푖푛푑푟표푝푖 = |
|
⋮ |
|
푥11 ⋮ 푥푘1 |
|
… |
|
푥1,푛푘푒푦푤표푟푑푠 ⋮ 푥푘,푛푘푒푦푤표푟푑푠 |
|
푥1,푛푘푒푦푤표푟푑푠+1 ⋮ 푥푘,푛푘푒푦푤표푟푑푠+1 |
|
. |
|
)13( |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
… |
|
|
|
|
|
|
|
|
|
|
نآ تیفیک یبایزرا و هرطق ره راکدوخ یدنبهشوخ -3-2 |
|
تیفیک هلصاف شهاک( متیروگلا ییارگمه ای 푀푎푥푖푡푒푟 ینعی زاجم رارکت دادعت رثکادح هب ندیسر هک متیروگلا یاهرارکت فقوت طرش هلحرم نیا رد |
|
ناونعهب هرطق نیرتهب شیامن و متیروگلا همتاخ ،طرش ققحت تروص رد .دوشیم لرتنک )صخشم کچوک ددع کی زا باوج نیرتهب ات اهباوج |
|
푀푎푥푖푡푒푟 رثکادح و رابکی لقادح یرارکت دنیآرف نیا یارجا .دوشیم ارجا متیروگلا یرارکت دنیآرف تروص نیاریغرد و دریذپیم تروص باوج نیرتهب |
|
|
.داد دهاوخ خر راب |
|
و ))3( هلداعم( هرطق ره لاعف یاههشوخ زکارم ات دانسا هلصاف هبساحم ینعی 4 ماگ ،هرطق ره یارب لاعف یاههشوخ زکارم نییعت ینعی 3 ماگ یارجا |
|
یادتبا رد )3-2 شخبریز( راکدوخ یدنبهشوخ دنیآرفزا ))4( هلداعم( تسا نیرتکیدزن هک هشوخ زکرم کی هب اهنت دنس ره قلعت نییعت ینعی 5 ماگ |
|
رادقم ناونعهب و هبساحم ))8( هلداعم( DB صخاش ،هرطق ره زا هدمآتسدهب یدنبهشوخ تیفیک هبساحم روظنمهب .دنوشیم ماجنا رارکت هقلح ره |
|
یاهیدنبهشوخ یارب زین ))11( هلداعم( CS صخاش هبساحم .تشاد دهاوخ ار DBرادقم نیرتمک ،هرطق نیرتهب .دوشیم هتفرگ رظن رد نآ شزارب |
|
هیوناث تیفیک ناونعهب و هدشن لامعا تارطق شزارب دنیآرف رد یداهنشیپ متیروگلا هفده کت تیهام هب هجوت اب یلو دوشیم هبساحم تارطق زا لصاح |
|
|
.دش دهاوخ هیارا باوج |
|
|
هناخدور و ایرد باختنا -3-3 |
|
رادقم نیرتمک هک یاهرطق .دنوشیم باختنا اههناخدور و ایرد ناونعهب )دنتسه DB رادقم نیرتمک یاراد هک( تارطق نیرتهب زا هرطق 푠푟 دادعت هب |
|
تارطق( تیعمج یقاب و تسا ایرد کی و اههناخدور زا یاهعومجم 푁푠푟 ،تقیقحرد .دوشیم هتفرگ رظن رد ایرد ناونعهب ،دراد نارگید نایم رد ار DB |
|
.دنوشیم یراج ایرد تمس هب امیقتسم ای اههناخدور تمس هب تانایرج نیا .دنهدیم لکش ار اهنایرج ،)ناراب |
|
푁푠푡푟푒푎푚 = |
|
푁푝표푝 − 푁푠푟. |
|
)14( |
|
:دوشیم هدافتسا ریز هلداعم زا ،ندش یراج تدشهب هجوت اب ایرد ای اههناخدور هب ناراب تارطق صیصخت یارب |
|
푁푆푛 = 푟표푢푛푑 {| | × 푁 푡푟푒푎푚 }, 푛 = 1,2,…,푁 푟, )15( 푖=1 푖 یاهسیرتام ریداقم ریثات تحت اهنآ تیعقوم سیرتام رگیدترابعهب ای دنزیریم ایرد ای صاخ یاههناخدور هب هک دنتسه ییاهنایرج دادعت 푁푆푛 هک |
|
|
.تفرگ دنهاوخ رارق ایرد ای صخشم یاههناخدور |
|
|
تیعقوم دوبهب -3-4 |
|
سیرتام رییغت اب رما نیا .دشابیم ایرد تمس هب اههناخدور تکرح و اههناخدور تمس هب اهنایرج تکرح متیروگلا نیا رد تیعقوم دوبهب زا روظنم |
|
کی هک 퐶 یفداصت ماگ لوط اب 푅푎푖푛푑푟표푝푠푡푟푒푎푚 هناخدور سیرتام تیعقوم تمس هب تکرح یاتسار رد tth رارکت رد 푅푎푖푛푑푟표푝푠푡푟푒푎푚 نایرج تیعقوم |
|
퐶 × (푅푎푖푛푑푟표푝푅푖푣푒푟 − 푅푎푖푛푑푟표푝푠푡푟푒푎푚) ات رفص نیب یفداصت تروصهب رییغت نازیم نیا .دریگیم ماجنا تسا )2 هب کیدزن( 2 و 1 نیب رادقم |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
1 |
|
1076 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
رداق اهنایرج هک دوشیم ثعاب کی زا رتشیب 퐶 رادقم .تسا هدش هداد شیامن 3 لکش رد هناخدور تمس هب نایرج تکرح یلک یامن .دشابیم |
|
|
.دنیامن تکرح اههناخدور تمس هب فلتخم یاهتهج رد ،دنشاب |
|
|
푅푎푖푛푑푟표푝푅푖푣푒푟 |
|
|
|
هناخدور |
|
|
|
푅푎푖푛푑푟표푝푠푡푟푒푎푚 |
|
|
|
دیدج نایرج تیعقوم |
|
|
|
푅푎푖푛푑푟표푝푠푡푟푒푎푚 |
|
|
|
نایرج |
|
هناخدور تمس هب نایرج 퐂 ماگ لوط اب رثکادح تکرح |
|
|
|
.رگید هناخدور کی تمس هب اهنایرج تکرح زا یلک دید -3 لکش |
|
|
|
Figure 3- A general view for moving streams towards river. |
|
|
:دیآیم تسد هب ریز تروصهب اههناخدور و اهنایرج دیدجتیعقوم نیاربانب ؛دبای میمعت زین ایرد تمس هب اههناخدور تکرحیاربدناوتیمموهفم نیا |
|
|
푅푎푖푛푑푟표푝푠푡푟푒푎푚 = 푅푎푖푛푑푟표푝푠푡푟푒푎푚 + 푟푎푛푑× 퐶 × (푅푎푖푛푑푟표푝푡 푖푣푒푟 − 푅푎푖푛푑푟표푝푠푡푟푒푎푚). |
|
)16( |
|
|
푅푎푖푛푑푟표푝푅푖푣푒푟 = 푅푎푖푛푑푟표푝푅푖푣푒푟 + 푟푎푛푑× 퐶 × (푅푎푖푛푑푟표푝푠푒푎 − 푅푎푖푛푑푟표푝푅푖푣푒푟), |
|
)17( |
|
یهناخدور زا رتهب نایرج کی طسوت هدمآتسدهب باوج تیفیک رگا .تسا [0,1] نیب تخاونکی تروصهب هدشعیزوت یفداصت ددع کی 푟푎푛푑 هک |
|
یاییاجباج نینچ .)دوشیم هناخدور نایرج و دوشیم نایرج هناخدور ینعی( دوشیم اجباج نایرج و هناخدور یاهتیعقوم ،دشاب نآ هب لصتم |
|
هناخدور اب ار تسا نیرتهب اهنایرج رگید نایم رد هک ار ینایرج ییاجباج ،4 لکش .دتفیب قافتا زین ایرد و اههناخدور یارب هباشم روطهب دناوتیم |
|
|
.دهدیم ناشن |
|
|
.اهنایرج رگید نیب رد نایرج نیرتهب دامن هایس گنر اب هریاد و هناخدور دامن هراتس هک اههناخدور و اهنایرج تیعقوم هلدابم -4 لکش |
|
|
Figure 4- Echanging positions of streams and rivers, where the star symbolizes the river and the circle with black color symbolizes the best stream among other streams. |
|
|
|
ریخبت -3-5 |
|
رد ربا لیکشت یارب رفسمتا رد هدش ریخبت بآ .دنک یریگولج متیروگلا سردوز ییارگمه زا دناوتیم هک تسا یمهم رایسب یاهروتکاف زا یکی ریخبت |
|
تمس هب دیدج یاهنایرج و دنکیم داجیا ار دیدج یاهنایرج ناراب .دنادرگیمرب نیمز هب ناراب لکش هب ار بآ ربا و دوشیم مکارتم ،رتدرس رفسمتا |
|
نایرج/هناخدور دننام ایرد بآ هک دوشیم ثعاب ،ریخبت دنیآرف هدشهیارا شور رد .تسا بآ یهخرچ ،هخرچ نیا .دنوشیم یراج ایرد ای اههناخدور |
|
رد ار ریز دک هبش .تسا هدش هتفرگ رظن رد یلحم هنیهب رد نتفرگ رارق زا یریگولج روظنمهب ضرف نیا .دوش ریخبت ،دنتسه یراج ایرد تمس هب هک |
|
|
:دیریگب رظن |
|
ارجا )20( و )19( یاههلداعم بسحرب ار یگدنراب و ریخبت دنیآرف هاگنآ 푖 = 1,2,3,…,푁 푟 − 1 یازا هب |푋푠푒푎 − 푋푅푖푣푒푟 | < 푑푚푎푥 |
|
رگا |
|
|
.دینک |
|
077 |
|
.تسا هدش قحلم ایرد هب هناخدور هک دهدیم ناشن ،دشاب 푑푚푎푥 زا رتمک ایرد و هناخدور نیب هلصاف رگا .تسا رفص هب کیدزن کچوک ددع کی 푑푚푎푥 |
|
.دش دهاوخ زاغآ تبوطر ،ریخبت لمع یفاک نازیم زا دعب مینیبیم تعیبط رد هک روطنامه و دوشیم ماجنا ریخبت دنیآرف ،تیعضو نیا رد |
|
تدش ایرد کیدزن وجوتسج ،دوشیم ثعاب کچوک رادقم هکیلاحرد ،دهدیم شهاک ار ایرد هب کیدزن یوجوتسج 푑푚푎푥 یارب گرزب رادقم کی |
|
ریز تروصهب یقیبطت تروصهب |
|
푑푚푎푥 رادقم هنیهب درکیور کی ناونعهب اذل .دنکیم لرتنک ار ایرد یکیدزن رد وجوتسج تدش 푑푚푎푥 نیاربانب .دبای |
|
|
:دباییم شهاک |
|
푑푖 푑푚푎푥 = 푑푚푎푥 − 푚푎푥푖푡푒푟푎푡푖표푛. |
|
)18( |
|
|
شراب دنیآرف -3-6 |
|
هیبش( دنهدیم لکش فلتخم یاهناکم رد ار ییاهنایرج دیدج ناراب تارطق یگدنراب دنیآرف رد .دوشیم ماجنا شراب ،ریخبت دنیآرف لمع زا دعب |
|
:دوشیم هدافتسا ریز هلداعم ،هدشدیلوت و دیدج یاهنایرج یاهناکم ندرک صخشم یارب .)کیتنژ متیروگلا رد شهج رگلمع |
|
푥푠푡푟푒푎푚 = 퐿퐵 + 푟푎푛푑 × (푈퐵 − 퐿퐵). |
|
)19( |
|
هناخدور کی ناونعهب ،تسا هدشلیکشت ادیدج هک یناراب یهرطق،اددجم .دناهدش فیرعت هلئسم طسوت هک دنتسه ییلااب و نییاپیهدودحم UBو LB |
|
،دنتسه یراج ایرد ای هناخدور تمس هب هک یدیدج یاهنایرج لیکشت یارب دیدج تارطق یهیقب .دوشیم هتفرگ رظن رد ،دوریم ایرد تمس هب هک |
|
رد ،دنتسه یراج ایرد تمس هب هک ییاهنایرج یارب طقف ریز هلداعم متیروگلا یتابساحم درکلمع و ییارگمه خرن شیازفا روظنمهب .دناهدش ضرف |
|
.دشخب دوبهب ار ایرد یکیدزن رد شواک دراد دصق هلداعم نیا .تسا هدش هتفرگ رظن |
|
푋푠푡푟푒푎푚 = 푋푠푒푎 + |
|
√휇 |
|
× 푟푎푛푑푛(1,푁 푎푟), |
|
)20( |
|
.تسا تخاونکی یهدش عیزوت یفداصت ددع کی randn .دهدیم ناشن ار ایرد کیدزن وجوتسج یهیحان یهدودحم هک تسا بیرض کی 휇 هک |
|
یهیحان رد متیروگلا دوشیم ثعاب 휇 یارب رتکچوک ریداقم رگیدترابعهب .دهدیم شیازفا ار هجوم یهیحان زا جورخ ناکما 휇 یارب رتگرزب ریداقم |
|
|
ک |
|
|
و |
|
چ ،تسا هدش هبساحم ،دتفایم قافتا همتاخ طرش هک ییاج رد هجیتن نیرتهب ،تسا هدش هتفرگ رظن رد متیروگلا نیا رد هک روطنامه ،همتاخ طرش یارب دید کی .دسرب ییارگمه رایعم هب هک ینامز ات دوریم شیپ رارکت نیرتشیب ات بآ یهخرچ متیروگلا . ... و CPU نامز ،اهرارکت دادعت نیرتشیب لاثم |
|
.دناطبترم ایرد و اههناخدور ،)اهرهن( اهنایرج اب بیترت هب یزول و اههراتس و اههریاد هک دینیبب دیناوتیم 5 لکش رد ار هدشهیارا شور زا یاهسیاقم .دننکیم هراشا اههناخدور و اهرهن طسوت هدشادی پ دیدج تیعقوم هب یلاخوت دیفس یاهلکش |
|
|
ن |
|
|
ز |
|
ایرد |
|
د |
|
|
ی |
|
|
ک |
|
|
د |
|
.بآ هخرچ متیروگلا زا یراتخاس ییامن -5 لکش |
|
ر |
|
|
|
|
ی |
|
|
Figure 5- Semantic view of WCA. |
|
|
|
|
ا |
|
|
ب |
|
|
ه |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
1 |
|
1078 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
|
جیاتن لیلحت و یزاسهدایپ -4 |
|
|
درادناتسا یاههداد هعومجم -4-1 |
|
تلااقم تاعلاطا یواح هک AAAI 2013 و NIPS 2015 درادناتسا هداد هعومجم ود زا قیقحت نیا رد یداهنشیپ شور تیفیک یبایزرا روظنمهب |
|
403 تاعلاطا یواح NIPS 2015 هداد هعومجم .تسا هدش هدافتسا دنتسه یعونصم شوه و نیشام یریگدای هزوح رد سنارفنک ود هب هدشهیارا |
|
تیاس زا هداد هعومجم نیا .دشابیم ،دش رازگرباداناک لارتنوم رهش رد و 2015 لاس رد هک1یبصع شزادرپیاهمتسیس سنارفنک رد هدشرشتنم هلاقم |
|
.تسا هلاقم نتم ،هدیکچ ،ناگدنسیون مان ،)ینارنخس و یهافش /رتسوپ /هیارا( هیارا عون ،هلاقم ناونع ،هلاقم هسانش لماش و هدشهتفرگ Kaggle2 |
|
2013 لاس رد هک3یعونصم شوه تفرشیپ نمجنا سنارفنک نیمتفه وتسیب رد هدشرشتنم هلاقم 150 تاعلاطا یواح AAAI 2013 هداد هعومجم |
|
یاراد هلاقم ره یارب و هدوب مهارف UCI4هداد نزخم قیرط زا هداد هعومجم نیا هب یسرتسد .دشابیم ،هدشرازگرب هدحتمتلاایا نتگنشاو رهش رد و |
|
طسوت هدشباختنا نییاپ حطس یدیلک تاملک( تاعوضوم ،)هدنسیون طسوت هدشدیلوت یدیلک تاملک( یدیلک تاملک ،هلاقم ناونع ریظن یتاعلاطا |
|
هدشهیارا تسیل زا هدنسیون طسوت هدشباختنا یلااب حطس یدیلک تاملک( لااب حطس یدیلک تاملک ،)سنارفنک طسوت هدشهیارا تسیل زا هدنسیون |
|
ناونعهب هلاقم نوتم و هدیکچ ،ناونع ،NIPS 2015 هداد هعومجم یارب قیقحت نیا رد هک تسا رکذ نایاش .دشابیم هدیکچ و )سنارفنک طسوت |
|
،AAAI 2013 هداد هعومجم دروم رد هکیلاحرد .دسریم 5280 هب تاملک هزادنا ،بیترت نیا هب .دناهتفرگ رظن رد هدشهداد تلااقم یارب ییاهیگژیو |
|
هب عبانم ریاس و [66] رد هداد هعومجم ود نیا یدیلک تاملک یاهربا .دسریم هژاو 498 هب تاملک دادعت ،هدشهیارا اهیگژیو هیلک نتفرگ رظن رد اب |
|
|
.دناهدش میسرت 6 لکش حرش |
|
|
AAAI 2013 هداد یدیلک تاملک ربا |
|
NIPS 2015هداد یدیلک تاملک ربا |
|
|
.قیقحت نیا رد هدافتسا دروم یاههداد هعومجم یدیلک تاملک یمجح هسیاقم و عیزوت -6 لکش |
|
|
Figure 6- Distribution and volume comparison of the keywords of the datasets used in this research. |
|
|
هدش یزاسهدایپ یاهمتیروگلا یاهرتماراپ میظنت -4-2 |
|
شور اب سپس و هدش صخشم (퐾 = 10) رثکادح رادقم کی اب اههشوخ دادعت ادتبا رد .تسا راکدوخ تیهام یاراد یداهنشیپ یدنبهشوخ کینکت |
|
هدش هسیاقم مهم یراکتبا ارف متیروگلا دنچ اب یملع یاهسنارفنک زا هداد هعومجم ود یور قیقحت نیا .دوشیم صخشم اههشوخ دادعت هدشهیارا |
|
دادعت اب یدعبهس یددع عون زا یعونصم یاههداد یور ادتبا هدشحرطم یراکتبا ارف یاهمتیروگلا یور یداهنشیپ متیروگلا یزاسهدایپ زا لبق .تسا |
|
|
.دنوش صخشم ناسکی طیارش رد اهمتیروگلا نیا رد هدشفیرعت یاهرتماراپ ات دندشارجا اهمتیروگلا همه 3 هشوخ |
|
|
.WCA متیروگلا یاهرتماراپ هیلوا ریداقم -2 لودج |
|
|
Table 2- Initial values of WCA parameters. |
|
|
ریغتم |
|
تاحیضوت |
|
|
Npop = 50 |
|
تیعمج دادعت |
|
|
Nsr = 4 |
|
ایرد و هناخدور دادعت |
|
|
dmax = 1e − 16 |
|
ریخبت طرش |
|
|
Maxiter = 300 |
|
رارکت دادعت |
|
1 Neural Information Processing Systems (NIPS) 2 https://www.kaggle.com/datasets/benhamner/nips-2015- papers |
|
3 Associationof theAdvancementof Artificial Intelligence (AAAI) 4https://archive.ics.uci.edu/dataset/314/aaai+2013+accept ed+papers |
|
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
|
1079 |
|
.یلضافت لماکت متیروگلا یاهرتماراپ هیلوا ریداقم -3 لودج |
|
Table 3- Initial values of differential evolution algorithm (DEA) parameters. ریغتم تاحیضوت |
|
Npop = 50 |
|
تیعمج دادعت |
|
βmin = 0.2 |
|
سایقم رتماراپ رادقم نیرتمک |
|
βmin = 0.8 |
|
سایقم رتماراپ رادقم نیرتشیب |
|
PCR = 0.2 |
|
عطاقت لامتحا |
|
Maxiter = 300 |
|
رارکت دادعت |
|
.کیتنژ متیروگلا یاهرتماراپ هیلوا ریداقم -4 لودج |
|
Table 4- Initial values of Genetic Algorithm (GA) parameters. ریغتم تاحیضوت |
|
Npop = 50 |
|
تیعمج دادعت |
|
RS = 0.8 |
|
باختنا بیرض |
|
P = 0.3 |
|
مزومرک ره شهج لامتحا |
|
Rmut = 0.02 |
|
نژ ره شهج خرن |
|
P = 0.8 |
|
عطاقت لامتحا |
|
Maxiter = 300 |
|
رارکت دادعت |
|
.لسعروبنز متیروگلا یاهرتماراپ هیلوا ریداقم -5 لودج |
|
Table 5- Initial values of Artificial Bee Colony Algorithm (ABC) parameters. ریغتم تاحیضوت |
|
Npop = 50 |
|
تیعمج دادعت |
|
NOnlooker = Npop |
|
رگاشامت یاهروبنز دادعت |
|
L = round(0.5 × NVar × Npop) |
|
یراذگاو تیدودحم رتماراپ |
|
|
a = 1 |
|
باتش بیرض یلاب نارک |
|
Maxiter = 300 |
|
رارکت دادعت |
|
.PSO متیروگلا یاهرتماراپ هیلوا ریداقم -6 لودج |
|
Table 6- Initial values of Particle Swarm Optimization (PSO) algorithm parameters. ریغتم تاحیضوت |
|
|
Npop = 50 |
|
تیعمج دادعت |
|
|
w = 0.73 |
|
یسرنیا ینزو بیرض |
|
|
wdamp = 1 |
|
لیدعت خرن |
|
|
c1 = 1.5 |
|
سفنهبدامتعا بیرض |
|
|
c2 = 1.5 |
|
عامتجا اب دامتعا بیرض |
|
Vmax = 0.1 × (Varmax − Varmin) Vmin = −Vmax Maxiter = 300 |
|
تارذ تعرس رثکادح و لقادح |
|
|
|
|
رارکت دادعت |
|
|
هدمآتسدهب جیاتن لیلحت -4-3 |
|
شیامن یاهلدم زا نینچمه .دنتفرگ رارق هسیاقم دروم PSO و لسعروبنز ،یلضافت لماکت ،بآ هخرچ یراکتبا ارف یاهمتیروگلا هلحرم نیا رد |
|
یاهنشیتراپ ندوب بولطم هبساحم روظنمهب .تسا هدش هدافتسا زین ،دناهدش هداد حرش لابق هک |
|
word2vecو TF-IDF و TF هلمج زا فلتخم |
|
یزاسادج نازیم ،7 لودج رد .تسا هدش هدرب راکب و یزاسهدایپ زین )8 لودج( DB و )7 لودج( CS یجنس رابتعا صخاش ود هدمآتسدهب |
|
زیامت هدنهدناشن نآ رتمک ریداقم هک هدش هسیاقم ویریگهزادنا رگید یراکتباارفمتیروگلا هس و بآ هخرچمتیروگلا یارب CS صخاش طسوت اههشوخ |
|
هس یاقم رد یرتهب CSرادقم تسا هتسناوت ،اهنآ نی ب یناشوپمه شهاک و اههشوخ راتخاس یزاسهنیهب اب بآ هخرچ مت یروگلا .تسا اههشوخ نیب رتهب |
1080 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
یلضافت لماکت زا رتنییاپ بآ هخرچ مت یروگلا یارب CS صخاش رادقم ،NIPS 2015 یاههداد رد ،لاثم ناونعهب .دهد هیارا هباشم یاهمت یروگلا اب |
|
|
.تسا هدوب |
|
|
.CS صخاش ساسا رب یراکتبا ارف فلتخم یاهمتیروگلا هسیاقم -7 لودج |
|
|
|
هعومجم |
|
Table 7- Comparison of different meta-heuristic algorithms based on CS index. دادعت لدم دادعت بآ هخرچ یلضافت لماکت لسعروبنز |
|
PSO |
|
|
اههداد |
|
دانسا |
|
شیامن |
|
تاملک |
|
دادعت |
|
WCA صخاش |
|
دادعت |
|
صخاش |
|
دادعت |
|
صخاش |
|
دادعت |
|
صخاش |
|
|
هشوخ |
|
CS |
|
هشوخ |
|
CS |
|
هشوخ |
|
CS |
|
هشوخ |
|
CS |
|
|
AAAI 2013 |
|
150 |
|
tfidf |
|
498 |
|
2 |
|
2.1570 |
|
2 |
|
2.3056 |
|
2 |
|
2.2935 |
|
2 |
|
2.3181 |
|
|
3 3 2 2 3 2 2 |
|
2.1341 2.2139 2.1021 2.1147 2.2178 2.1362 2.1742 |
|
2 2 2 2 2 2 2 |
|
2.2260 2.2018 2.1420 2.1811 2.1398 2.1570 2.2940 |
|
2 2 2 2 2 2 2 |
|
2.4970 2.487 2.3465 2.2178 2.4190 2.1362 2.2882 |
|
2 2 2 2 2 2 2 |
|
2.3040 2.4731 2.2809 2.2445 2.2143 2.2520 2.2682 |
|
|
3 2 |
|
2.1149 2.0715 |
|
2 2 |
|
2.1604 2.1774 |
|
2 2 |
|
2.4557 2.3345 |
|
2 2 |
|
2.3157 2.2151 |
|
|
NIPS 2015 |
|
403 |
|
tfidf |
|
5280 |
|
2 2 2 2 2 2 |
|
1.8756 2.1502 1.9738 2.0828 2.1252 2.2312 |
|
2 2 2 2 2 2 |
|
1.8637 2.4585 2.1767 2.3225 2.3012 2.0259 |
|
2 2 2 2 2 2 |
|
2.5287 2.3025 2.4123 2.3982 2.1654 2.4327 |
|
2 2 2 2 2 2 |
|
2.4163 2.4675 2.4051 2.3808 2.3545 2.4530 |
|
|
2 2 2 2 |
|
1.8725 1.9050 1.9254 2.1025 |
|
2 2 2 2 |
|
2.1367 2.0254 2.3412 2.030 |
|
2 2 2 2 |
|
2.1656 2.2343 2.3547 2.3014 |
|
2 2 2 2 |
|
2.4891 2.4321 2.3018 2.3542 |
|
ارف متیروگلا هس و بآ هخرچ متیروگلا یارب DB صخاش ساسا رب یاهشوخ نیب یزاسادج اب ار یاهشوخ نورد ماجسنا نازیم زین 8 لودج رد |
|
یاههشوخ نی ب رتشیب هلصاف و هشوخ ره رد اههداد رتلااب ماجسنا هدنهدناشن DB صخاش رتمک ریداقم هک هدش هسیاقم و یریگهزادنا رگید یراکتبا |
|
.تسا هدش لصاح اهنآ ناکم رثوم یزاسهنیهب و هشوخ زکارم راکدوخ میظنت ل یلد هب DB رتنییاپ ریداقم ،بآ هخرچ مت یروگلا رد .تسا فلتخم |
|
هداد هیارا لسعروبنز و PSO دننام رگید یاهمت یروگلا هب تبسن یرتمک DB رادقم بآ هخرچ مت یروگلا ،AAAI 2013 هداد هعومجم رد ،لاثم روطهب |
|
|
.تسا |
|
|
.DB صخاش ساسا رب یراکتبا ارف فلتخم یاهمتیروگلا هسیاقم -8 لودج |
|
|
|
هعومجم |
|
Table 8- Comparison of different meta-heuristic algorithms based on DB index. دادعت لدم دادعت بآ هخرچ یلضافت لماکت لسعروبنز |
|
PSO |
|
|
اههداد |
|
دانسا |
|
شیامن |
|
تاملک |
|
دادعت |
|
WCA صخاش |
|
دادعت |
|
صخاش |
|
دادعت |
|
صخاش |
|
دادعت |
|
صخاش |
|
|
هشوخ |
|
DB |
|
هشوخ |
|
DB |
|
هشوخ |
|
DB |
|
هشوخ |
|
DB |
|
|
AAAI 2013 |
|
150 |
|
tfidf |
|
498 |
|
2 2 2 2 2 2 2 2 2 2 |
|
1.4644 1.505 1.4657 1.4553 1.4607 1.4394 1.4482 1.4434 1.4521 1.4438 |
|
2 2 2 2 2 2 2 2 2 2 |
|
2.043 2.0865 2.0885 2.0844 2.0903 2.0926 2.1057 2.0849 2.0570 2.1040 |
|
2 2 2 2 2 2 2 2 2 2 |
|
2.1376 2.1259 2.1036 2.1156 2.1303 2.0991 2.1287 2.1087 2.1246 2.1287 |
|
3 2 2 2 3 2 2 2 2 2 |
|
2.2284 1.8643 1.9035 1.8923 2.1917 1.8851 1.9175 1.9911 1.8934 1.8329 |
|
|
NIPS 2015 |
|
403 |
|
tfidf. |
|
5280 |
|
2 |
|
1.9078 |
|
2 |
|
2.3813 |
|
2 |
|
2.3779 |
|
2 |
|
2.3276 |
|
|
2 3 2 3 2 2 2 2 |
|
1.8734 1.9653 1.9553 1.9456 1.9356 1.9113 1.8354 1.9587 |
|
2 2 2 2 2 2 2 2 |
|
2.4547 2.4258 2.3901 2.3940 2.3025 2.4052 2.3625 2.4456 |
|
2 2 2 2 2 2 2 2 |
|
2.4020 2.3255 2.3625 2.3878 2.4250 2.3545 2.4430 2.4658 |
|
2 3 2 2 2 2 2 2 |
|
2.3644 2.5131 2.4060 2.3568 2.3623 2.3455 2.4621 2.4252 |
|
|
2 |
|
1.9420 |
|
2 |
|
2.3455 |
|
2 |
|
2.4781 |
|
2 |
|
2.4230 |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
|
1081 |
|
مت یروگلا رتهداس راتخاس لیلد هب یگژ ی و نیا .دراد زی ن یرتمک یارجا نامز هکلب دهدی م هیارا یدنبهشوخ رد یرتلااب تقد اهنتهن بآ هخرچ مت یروگلا |
|
ره رد بآ هخرچ مت یروگلا هک دنهدیم ناشن جیاتن .دنکیم مهارفار م یجح یاههداد اب ع یرس قیبطت ناکما هک تسا نآ رتع یرس یزاسهن یهب مزیناکم و |
|
مت یروگلا ،ارجا نامز هس یاقم رد ،لاثم یارب .تسا هتشاد یرتهب درکلمع اهمت یروگلا ریاس هب تبسن NIPS 2015 و AAAI 2013 هداد هعومجم ود |
|
لیاسم یارب ینامز ت یزم نیا .تسا هدرکلمعلسعروبنز زا رتع یرس 20%و PSOزا رتع یرس 30%اب یرقت NIPS 2015هداد هعومجم رد بآ هخرچ |
|
.دراد یاهژ یو تیمها سایقمگرزب |
|
.AAAI2013 یاههداد یور CS عبات ریداقم رادومن -7 لکش |
|
Figure 7- The Curve of CS function values on AAAI2013 dataset. |
|
.AAAI2013 یاههداد یور DB عبات ریداقم رادومن -8 لکش |
|
Figure 8- The Curve of DB function values on AAAI2013 dataset. |
|
.NIPS2015 یاههداد یور CS عبات ریداقم رادومن -9 لکش |
|
Figure 9- The Curve of CS function values on NIPS2015 dataset. |
1082 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
|
|
1064-1086:هحفص |
|
|
|
|
|
.NIPS2015 یاههداد یور DB عبات ریداقم رادومن -10 لکش |
|
|
|
Figure 10- The Curve of DB function values on NIPS2015 dataset. |
|
|
|
شزادرپشیپ یاهکینکت ریثات یسررب -4-4 |
|
یارب صاخ روطهب لحارم ن یا .دناهدش لامعا اهرادربداعبا شهاک و یبایهش یر ،فقوت تاملک فذحلماش شزادرپشیپ کینکت ن یدنچ ،هلاقم نیا رد |
|
و فقوت تاملک فذح ربلمتشم شزادرپشیپ کینکت هس هسیاقم 9 لودج رد .دناهدش هدافتسا ینتم یاههداد ز یون شهاک و اههشوخ ماجسنا دوبهب |
|
|
.تسا هدمآ یبایهشیر نودب و فقوت تاملک فذح طقف ،یبایهشیر |
|
|
.شزادرپشیپ یاهکینکت هسیاقم -9 لودج |
|
|
|
Table 9- Comparison of preprocessing techniques. |
|
شزادرپشیپ کینکت |
|
|
|
|
|
CS (NIPS 2015) |
|
DB (NIPS 2015) |
|
CS (AAAI 2013) |
|
DB (AAAI 2013) |
|
|
|
|
|
1.88 |
|
1.87 |
|
2.10 |
|
1.45 |
|
یبایهشیر یارجا و فقوت تاملک فذح |
|
|
|
2.15 |
|
2.05 |
|
2.35 |
|
1.60 |
|
فقوت تاملک فذح طقف |
|
|
|
2.30 |
|
2.15 |
|
2.50 |
|
1.72 |
|
یبایهشیر نودب |
|
|
زین یبایهشیر نودب نینچمه .تسا یدورو یاهرادرب رد رتشیب زیون لیلد هب یدنبهشوخ تیفیک شهاک هدنهدناشن جیاتن فقوت تاملک فذح نودب |
|
و فقوت تاملک فذح بیکرت لباقم رد .دشابیم اههشوخ ماجسنا شهاک هدنهدناشن هک هتفایشیازفا DB و CS یجنس رابتعا یاهصخاش ریداقم |
|
|
.تسا هداد دوبهب ار اههشوخ ماجسنا و هدش CS و DBیاهصخاش شهاک ثعاب یبایهش یر |
|
|
یریگهجیتن -5 |
|
عبانم و اهسنارفنک هب یلاسرا تلااقم رتهب یوجوتسج و یدنبهتسد یارب نآ دربراک و تسا یملع دانسا راکدوخ یدنبهشوخ قیقحت نیا فده |
|
یراکتبا ارف یاهمتیروگلا زا ،درادن دوجو یقیقد باوج اهنآ لح یارب لاومعم و دنتسه تخس NP عون زا هک لیاسم هنوگ نیا .دشابیم یتاقیقحت |
|
یبولطم هجیتن و هتفرگ رارق یبایزرا دروم فلتخم تاقیقحت رد هک دوشیم بوسحم دیدج یاهمتیروگلا وزج بآ هخرچ متیروگلا .دوشیم هدافتسا |
|
یایوپ و راکدوخ یدنبهشوخ درکیور اب بآ هخرچ متیروگلا زا هدافتسا اب یملع دانسا قیقحت نیا رد .تسا هتشاد هباشم یاهمتیروگلا هب تبسن |
|
هنیهب باختنا کی بآ هخرچ مت یروگلا هک دهدیم ناشن ینامز هسیاقم و CS و DBیاهصخاش عماج لیلحت راک هجیتن .دناهدش یدنبهتسد تلااقم |
|
فده یارب .دهدیم شهاک یهجوت لباق روطهب زین ار یتابساحم نامز ،لااب تقد هیارا نمض ار یز ،تسا نزاوتمان و میجح یاههداد یدنبهشوخ یارب |
|
دادعت یتسردهب هک تسا هدش هدافتسا دوشیم فیرعت اههشوخ یزاسلاعف هناتسآ ریغتم کی طسوت هک یژولونکت زا زین اههشوخ دادعت ندوب راکدوخ |
|
|
:دومن هصلاخ لیذ هدمع وحم جنپ رد ناوتیم ار قیقحت نیا هناروآون و یلصا یاهتکراشم رگیدترابعهب ؛دوشیم باختنا اههشوخ |
|
|
.دوب هدش هدافتسا یریوصت ای یددع یاههداد یارب لابق هک یملع ینتم یاههداد یارب بآ هخرچ متیروگلا قیبطت |
|
.1 |
|
|
.راکدوخ تروصهب اههشوخ دادعت یزاسهنیهب یارب هشوخ زکارم یزاسلاعفریغ و یزاسلاعف مزیناکم یفرعم |
|
.2 |
|
|
.یملع ینتم یاههداد رتهب شیامن یارب هتفایقیبطت TF-IDF لدم زا یریگهرهب |
|
.3 |
|
|
.یدنبهشوخ تیفیک لیلحت یاربCS وDB بیکرت دننام دیدج یبایزرا یاهصخاش هیارا |
|
.4 |
083 |
|
.نزاوتمان و میجح یاههداد یارب ییاراک دوبهب و متیروگلا یارجا نامز شهاک |
|
.5 |
|
تقد شیازفا ،اهسنارفنک و تلاجم رد یملع تلااقم یهدنامزاس و وجوتسج دنیآرف دوبهب هب ناوتیم زین قیقحت نیا یلمع یاهدمایپ نیرتمهم زا |
|
زا یدایز مجح اب هک ییاهنامزاس یارب یداهنشیپ شور راکدوخ یاهتیلباق زا یریگهرهب و تاعلاطا یبایزاب یاهمتسیس رد یدنبهتسد تعرس و |
|
)یسیلگنا نابز ساسا رب درادناتسا یاههداد هب هجوت اب( نابز کی ربینتبم یداهنشیپشور هک تسا رکذ نایاش .درکهراشا دنتسه وربور ینتم یاههداد |
|
هنابزدنچ طیارش رد یداهنشیپ شور اما ؛دوشیم بوسحم نآ یارب تیدودحم کی هک دنکیمن ینابیتشپ هنابزدنچ یملع دانسا زا و هدش یزاسهدایپ |
|
یاهلدم زا دیاب ایناث و هدوب )LangDetect متیروگلا دننام( اهنابز کیکفت و ییاسانش روظنمهب بسانم یاهمتیروگلا زا هدافتسا دنمزاین لاوا |
|
،هدنیآ یاهراک اذل .دیامن هدافتسا )نابز نآ شزادرپشیپ درادناتسا یاهشور و یبایهشیر دعاوق ،فقوت تاملک تسیل( صاخ نابز ره شزادرپشیپ |
|
.دریگ رارق راک روتسد رد دناوتیم هنابزدنچ دانسا هب شور شرتسگ یارب یز یرهمانرب |
|
صاوخ مامت ،یعقاو یگدنز رد اما ؛دننکیم هنیهب ار فده عبات ای یلخاد یبایزرا عبات کی ینمض روطهب دوجوم یدنبهشوخ یاهمتیروگلا رثکا |
|
رد دناوتیم هشوخ یجنسرابتعا صخاش دنچ نامزمه یزاسهنیهب نینچمه .درک یبایزرا صاخ فده عبات کی زا هدافتسا اب ناوتیمن ار اههشوخ |
|
هدافتسا دیدج یراکتبا ارف یاهمتیروگلا زا ناوتیم یداهنشیپ یاهراک ناونعهب .دنک کمک هداد هعومجم زا فلتخم یاهلکش هب ییاههشوخ نییعت |
|
یخرب لح یارب ناوتیم ار یداهنشیپ درکیور نینچمه .داد رارق یبایزرا دروم هفده کی یاجهب ار هفده دنچ یدنبهشوخ یاهشور نینچمه و دومن |
|
.دومن شیامزآ ... و وجوتسج جیاتن یدنبهشوخ ،نتم یزاسهصلاخ دننام لیاسم زا |
|
ینادردق و رکشت |
|
هتشاد ییازسهب شقن هلاقم تیفیک دوبهب رد ناشدنمشزرا تارظن کشیب .دنرادیم ملاعا مرتحم نارواد زا ار دوخ ینادردق بتارم هلاقم ناگدنسیون |
|
.تسا |
|
عفانم اب ضراعت |
|
هدهاشم ار هدشلاسرا ییاهن هخسن ،ناگدنس یون همه ،درادندوجو هخسن نیا راشتنا دروم رد عفانم رد یداضت چیه هک دنرادیم ملاعا هلاقم ناگدنس یون |
|
.دشابیمن راشتنا تحت رضاح لاح رد و هدشنپاچ لابق ،هدوب اهنآ یلصا رثا ،هلاقم هک دننکیم نیمضت ناگدنسیون .دناهدرک دییات و |
|
عبانم |
|
[1] Shamshiri, A., Ryu, K. R., & Park, J. Y. (2024). Text mining and natural language processing in construction. Automation in construction, 158, 105200. https://doi.org/10.1016/j.autcon.2023.105200 |
|
[2] Han, J., Kamber, M., & Pei, J. (2012). Data mining concepts and techniques third edition. https://www.sciencedirect.com/book/9780123814791/data-mining-concepts-and-techniques |
|
[3] Aggarwal, C. C. (2015). Mining text data. In Data mining (pp. 429–455). Springer. https://doi.org/10.1007/978-3-319-14142- 8 |
|
[4] Mohammed, S. M., Jacksi, K., &Zeebaree, S. (2021). A state-of-the-art survey on semantic similarity for document clustering using GloVe and density-based algorithms. Indonesian journal of electrical engineering and computer science, 22(1), 552– 562. https://pdfs.semanticscholar.org/536a/79867b8e2b068dd8018d2870ff6fc5aa6427.pdf/1000 |
|
[5] Rashid, J., Shah, S. M. A., & Irtaza, A. (2020). An efficient topic modeling approach for textmining and information retrieval through K-means clustering. Mehran university research journal of engineering & technology, 39(1), 213–222. https://search.informit.org/doi/abs/10.3316/informit.949374222927473 |
|
[6] Toman, S. H., Abed, M. H., & Toman, Z. H. (2020). Cluster-based information retrieval by using (K-means)-hierarchical parallel genetic algorithms approach. https://doi.org/10.48550/arXiv.2008.00150 |
|
[7] Onan, A. (2019). Two-stage topic extraction model for bibliometric data analysis based on word embeddings and clustering. IEEE access, 7, 145614–145633. https://ieeexplore.ieee.org/abstract/document/8861084 |
|
[8] Abasi, A. K., Khader, A. T., Al-Betar, M. A., Naim, S., Makhadmeh, S. N., & Alyasseri, Z. A. A. (2021). A novel ensemble statistical topic extraction method for scientific publications based on optimization clustering. Multimedia tools and applications, 80, 37–82. https://doi.org/10.1007/s11042-020-09504-2 |
|
[9] Eler, D. M., Grosa, D., Pola, I., Garcia, R., Correia, R., & Teixeira, J. (2018). Analysis of document pre-processing effects in text and opinion mining. Information, 9(4), 100. https://doi.org/10.3390/info9040100 |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
1 |
|
1084 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
[10] |
|
Garg, N., & Sharma, K. (2022). Text pre-processing of multilingual for sentiment analysis based on social network data. International journal of electrical & computer engineering (2088-8708), 12(1). https://core.ac.uk/download/pdf/478033411.pdf |
|
[11] |
|
Basavaraju, M., & Prabhakar, D. R. (2010). A novel method of spam mail detection using text based clustering approach. International journal of computer applications, 5(4), 15–25. https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=278459cbdda843632e79d2fbc8afc60c5ac4fad1 |
|
[12] |
|
Delany, S. J., Buckley, M., & Greene, D. (2012). SMS spam filtering: Methods and data. Expert systems with applications, 39(10), 9899–9908. https://doi.org/10.1016/j.eswa.2012.02.053 |
|
[13] |
|
Jardim, S., & Mora, C. (2022). Customer reviews sentiment-based analysis and clustering for market-oriented tourism services and products development or positioning. Procedia computer science, 196, 199–206. https://doi.org/10.1016/j.procs.2021.12.006 |
|
[14] |
|
Roussinov, D., & Leon Zhao, J. (2004). Text clustering and summary techniques for CRM message management. Journal of enterprise information management, 17(6), 424–429. https://doi.org/10.1108/17410390410566715 |
|
[15] |
|
Sutanto, T., & Nayak, R. (2018). Fine-grained document clustering via ranking and its application to social media analytics. Social network analysis and mining, 8(1), 29. https://doi.org/10.1007/s13278-018-0508-z |
|
[16] |
|
Curiskis, S. A., Drake, B., Osborn, T. R., & Kennedy, P. J. (2020). An evaluation of document clustering and topic modelling in two online social networks: Twitter and Reddit. Information processing & management, 57(2), 102034. https://doi.org/10.1016/j.ipm.2019.04.002 |
|
[17] |
|
Kohli, S., & Mehrotra, S. (2016). A clustering approach for optimization of search result. Journal of images and graphics, 4(1), 63–66. https://www.joig.net/uploadfile/2016/0603/20160603081139220.pdf |
|
[18] |
|
Zamir, O. E. (1999). Clustering web documents: a phrase-based method for grouping search engine results. University of Washington. https://www.proquest.com/openview/31df6fa550ed2ab95b8a23bfbdfac209/1?pq- origsite=gscholar&cbl=18750&diss=y |
|
[19] |
|
Patil, D., & Dongre, Y. (2015). A clustering technique for email content mining. AIRCC’s international journal of computer science and information technology, 73–81. https://www.academia.edu/download/116082155/85e325250af1aebb8943b2b6bde8a772d99d.pdf |
|
[20] |
|
Xiang, Y. (2009). Managing email overload with an automatic nonparametric supercomputing, 48, 227–242. https://doi.org/10.1007/s11227-008-0216-y |
|
clustering |
|
system. |
|
The |
|
journal |
|
of |
|
[21] |
|
Halgekar, A., Rao, A., Khankhoje, D., Khetan, I., & Bhowmick, K. (2022). Topic modelling-based approach for clustering legal documents. In Information and communication technology for competitive strategies (ictcs 2021) ICT: applications and social interfaces (pp. 163–173). Springer. https://doi.org/10.1007/978-981-19-0095-2_17 |
|
[22] |
|
Poudyal, P., Gonçalves, T., & Quaresma, P. (2019). Using clustering techniques to identify arguments in legal documents. ASAIL@ icail, 2385. https://ceur-ws.org/Vol-2385/paper2.pdf |
|
[23] |
|
McMahon, C.(2015). A novel and domain-specific documentclusteringandtopicaggregation toolsetfora newsorganisation. Technological University Dublin. https://arrow.tudublin.ie/scschcomdis/71/ |
|
[24] |
|
Tarbani, N., & Wadhva, K. (2022). Aggregation of Semantically Similar News Articles with the Help of Embedding Techniques and Unsupervised Machine Learning Algorithms: A Machine Learning Application with Semantic Technologies. In Integrating meta-heuristics and machine learning for real-world optimization problems (pp. 107–120). Springer. https://doi.org/10.1007/978-3-030-99079-4_5 |
|
[25] |
|
Yau, C. K., Porter, A., Newman, N., & Suominen, A. (2014). Clustering Scientometrics, 100, 767–786. https://doi.org/10.1007/s11192-014-1321-8 |
|
scientific |
|
documents |
|
with |
|
topic |
|
modeling. |
|
[26] |
|
Aljaber, B., Stokes, N., Bailey, J., &Pei, J. (2010). Documentclustering ofscientific texts usingcitation contexts. Information retrieval, 13, 101–131. https://doi.org/10.1007/s10791-009-9108-x |
|
[27] |
|
Zhou, X., Hu, Y., &Guo, L. (2014). Text categorization based on clustering feature selection. Procedia computer science, 31, 398–405. https://doi.org/10.1016/j.procs.2014.05.283 |
|
[28] |
|
Ma, Y., Wang, Y., &Jin, B. (2014). Athree-phaseapproach to document clustering based ontopicsignificance degree. Expert systems with applications, 41(18), 8203–8210. https://doi.org/10.1016/j.eswa.2014.07.014 |
|
[29] |
|
Liu, C. L., Chang, T. H., & Li, H. H. (2013). Clustering documents with labeled and unlabeled documents using fuzzy semi- Kmeans. Fuzzy sets and systems, 221, 48–64. https://doi.org/10.1016/j.fss.2013.01.004 |
|
[30] |
|
Yuan, M., & Shi, Y. (2015). Text clustering based on a divide and merge strategy. Procedia computer science, 55, 825–832. https://doi.org/10.1016/j.procs.2015.07.153 |
|
[31] |
|
Vallejo-Huanga, D., Morillo, P., & Ferri, C. (2017). Semi-supervised clustering algorithms for grouping scientific articles. Procedia computer science, 108, 325–334. https://doi.org/10.1016/j.procs.2017.05.206 |
|
[32] |
|
Jun, S., Park, S. S., & Jang, D. S. (2014). Document clustering method using dimension reduction and support vector clustering to overcome sparseness. Expert systems with applications, 41(7), 3204–3212. https://doi.org/10.1016/j.eswa.2013.11.018 |
|
[33] |
|
Xu, S., Chan, K.-S., Gao, J., Xu, X., Li, X., Hua, X., & An, J. (2016). An integrated K-means–Laplacian cluster ensemble approach for document datasets. Neurocomputing, 214, 495–507. https://doi.org/10.1016/j.neucom.2016.06.034 |
|
[34] |
|
Sharma, I., Sharma, A., Chaturvedi, R., Rajpurohit, J., &Kumar, M. (2023). SKIFF: Spherical K-means with iterative feature filtering for text document clustering. Journal of information science, 5, 1-13. https://doi.org/10.1177/01655515231165 |
|
085 |
|
[35] |
|
Salih, N. M., & Jacksi, K. (2020). Semantic document clustering using k-means algorithm and ward’s method. 2020 international conference on advanced science and engineering (ICOASE) (pp. 1–6). IEEE. https://ieeexplore.ieee.org/abstract/document/9436588 |
|
[36] |
|
Jain, A. K. (2010). Data clustering: 50 years beyond K-means. Pattern recognition letters, 31(8), 651–666. https://doi.org/10.1016/j.patrec.2009.09.011 |
|
[37] |
|
Mikolov, T. (2013). Efficient estimation of word representations in vector space. https://doi.org/10.48550/arXiv.1301.3781 |
|
[38] |
|
Ran, X., Xi, Y., Lu, Y., Wang, X., &Lu, Z.(2023). Comprehensivesurvey on hierarchical clustering algorithms and therecent developments. Artificial intelligence review, 56(8), 8219–8264. https://doi.org/10.1007/s10462-022-10366-3 |
|
[39] |
|
Wei, T., Lu, Y., Chang, H., Zhou, Q., & Bao, X. (2015). A semantic approach for text clustering using WordNet and lexical chains. Expert systems with applications, 42(4), 2264–2275. https://doi.org/10.1016/j.eswa.2014.10.023 |
|
[40] |
|
Poostchi, H., & Piccardi, M. (2018). Cluster labeling by word embeddings and wordnet’s hypernymy [presentation]. Annual workshop of the australasian language technology association. https://opus.lib.uts.edu.au/handle/10453/132471 |
|
[41] |
|
Vallebueno, A., Handan-Nader, C., Manning, C. D., & Ho, D. E. (2024). Statistical uncertainty in word embeddings: GloVe- V. https://doi.org/10.48550/arXiv.2406.12165 |
|
[42] |
|
Pennington, J., Socher, R., & Manning, C. D. (2014). Glove: global vectors for word representation. Proceedings of the 2014 conference on empirical methods in natural language processing (Emnlp) (pp. 1532–1543). Association for Computational Linguistics. https://aclanthology.org/D14-1162.pdf |
|
[43] |
|
Danesh, M. (2011). Clustering of textual documents based on the concepts of neighborhood and semantic similarity [Thesis]. (In Persian). https://elmnet.ir/doc/10508462-41421 |
|
[44] |
|
Amiri, M., & Khotanlou, H. (2013). Document clustering based on ontology and fuzzy approach. Two quarterly journals of information and communication technology of Iran, 5(17), 73-96. (In Persian). https://jour.aicti.ir/fa/Article/1208/FullText |
|
[45] |
|
Guan, R., Zhang, H., Liang, Y., Giunchiglia, F., Huang, L., & Feng, X. (2020). Deep feature-based text clustering and its explanation. IEEE transactions on knowledge and data engineering, 34(8), 3669–3680. https://ieeexplore.ieee.org/abstract/document/9215004 |
|
[46] |
|
Xu, J., Wang, P., Tian, G., Xu, B., Zhao, J., Wang, F., & Hao, H. (2015). Short text clustering via convolutional neural networks. Proceedingsofthe1stworkshopon vectorspacemodelingfornaturallanguageprocessing (pp.62–69). Association for Computational Linguistics. https://aclanthology.org/W15-1509.pdf |
|
[47] |
|
Yi, J., Zhang, Y., Zhao, X., &Wan, J. (2017). A Novel Text Clustering Approach Using Deep‐Learning Vocabulary Network. Mathematical problems in engineering, 2017(1), 8310934. https://doi.org/10.1155/2017/8310934 |
|
[48] |
|
Mustafi, D., Mustafi, A., & Sahoo, G. (2022). A novel approach to text clustering using genetic algorithm based on the nearest neighbour heuristic. International journal of computers and applications, 44(3), 291–303. https://doi.org/10.1080/1206212X.2020.1735035 |
|
[49] |
|
Song, W., & Park, S. C. (2006). Genetic algorithm-based text clustering technique. Advances in natural computation: second international conference, ICNC, proceedings, part I 2 (pp. 779–782). Springer. https://doi.org/10.1007/11881070_103 |
|
[50] |
|
Song, W., Li, C. H., & Park, S. C. (2009). Genetic algorithm for text clustering using ontology and evaluating the validity of various semantic similarity measures. Expert systems with applications, 36(5), 9095–9104. https://doi.org/10.1016/j.eswa.2008.12.046 |
|
[51] |
|
Cui, X., Potok, T. E., & Palathingal, P. (2005). Document clustering using particle swarm optimization. Proceedings 2005 IEEE swarm intelligence symposium (pp. 185–191). IEEE. https://ieeexplore.ieee.org/abstract/document/1501621 |
|
[52] |
|
Janani, R., & Vijayarani, S. (2019). Text document clustering using spectral clustering algorithm with optimization. Expert systems with applications, 134, 192–200. https://doi.org/10.1016/j.eswa.2019.05.030 |
|
particle |
|
swarm |
|
[53] |
|
Abualigah, L. M., Khader, A. T., & Hanandeh, E. S. (2018). A new feature selection method to improve the document clustering using particle swarm optimization algorithm. Journal of computational science, 25, 456–466. https://doi.org/10.1016/j.jocs.2017.07.018 |
|
[54] |
|
Bharti, K. K., & Singh, P. K. (2016). Chaotic gradient artificial beecolony for text clustering. Soft computing, 20, 1113–1126. https://doi.org/10.1007/s00500-014-1571-7 |
|
[55] |
|
Forsati, R., Keikha, A., & Shamsfard, M. (2015). An improved bee colony optimization algorithm with an application to document clustering. Neurocomputing, 159, 9–26. https://doi.org/10.1016/j.neucom.2015.02.048 |
|
[56] |
|
Sadollah, A., Eskandar, H., & Kim, J. H. (2015). Water cycle algorithm for solving constrained multi-objective optimization problems. Applied soft computing, 27, 279–298. https://doi.org/10.1016/j.asoc.2014.10.042 |
|
[57] |
|
Taib, H., & Bahreininejad, A. (2021). Data clustering using hybrid water cycle algorithm and a local pattern search method. Advances in engineering software, 153, 102961. https://doi.org/10.1016/j.advengsoft.2020.102961 |
|
[58] |
|
Qiao, S., Zhou, Y., Zhou, Y., & Wang, R. (2019). A simple water cycle algorithm with percolation operator for clustering analysis. Soft computing, 23, 4081–4095. https://doi.org/10.1007/s00500-018-3057-5 |
|
[59] |
|
Liu, H., Tan, L., Jin, L., & Niu, B. (2020). Improved water cycle algorithm and k-means based method for data clustering. Intelligent computing methodologies: 16th international conference, icic 2020, bari, italy, october 2–5, 2020, proceedings, part III 16 (pp. 579–589). Springer. https://doi.org/10.1007/978-3-030-60796-8_50 |
|
[60] |
|
Gambhir, A., Payal, A., & Arya, R. (2020). Water cycle algorithm based optimized clustering protocol for wireless sensor network. Journal of interdisciplinary mathematics, 23(2), 367–377. https://doi.org/10.1080/09720502.2020.1731950 |
|
[61] |
|
Rodríguez, P., Bautista, M. A., Gonzalez, J., & Escalera, S. (2018). Beyond one-hot encoding: Lower dimensional target embedding. Image and vision computing, 75, 21–31. https://doi.org/10.1016/j.imavis.2018.04.004 |
... یملعدانساراکدوخ یدنبهشوخ یژولونکت /ناراکمه و داژنقازرلادبع |
1 |
|
1086 |
|
)1403( ،4 هرامش ،9 هرود |
|
تایلمعردقیقحتویریگمیمصت |
|
|
|
|
|
1064-1086:هحفص |
|
|
|
[62] |
|
Addiga, A., &Bagui, S. (2022). Sentiment analysis ontwitterdata usingterm frequency-inverse document frequency. Journal of computer and communications, 10(8), 117–128. https://doi.org/10.4236/jcc.2022.108008 |
|
[63] |
|
Rezaeinia, S. M., Rahmani, R., Ghodsi, A., & Veisi, H. (2019). Sentiment analysis based on improved pre-trained word embeddings. Expert systems with applications, 117, 139–147. https://doi.org/10.1016/j.eswa.2018.08.044 |
|
[64] |
|
Tenney, I., Xia, P., Chen, B., Wang, A., Poliak, A., McCoy, R. T., … Das, D. (2019). What do you learn from context? probing for sentence structure in contextualized word representations. https://doi.org/10.48550/arXiv.1905.06316 |
|
[65] |
|
Xu, R., Xu, J., & Wunsch, D. C. (2012). A comparison study of validity indices on swarm-intelligence-based clustering. IEEE transactions on systems, man, and cybernetics, part b (cybernetics), 42(4), 1243–1256. https://ieeexplore.ieee.org/abstract/document/6170593 |
|
[66] |
|
Saini, N., Saha, S., &Bhattacharyya, P. (2019). Automaticscientific document clustering using self-organizedmulti-objective differential evolution. Cognitive computation, 11, 271–293. https://doi.org/10.1007/s12559-018-9611-8 |