در عصر امروز، با وجود اینترنت و استفاده گسترده از آن، همه ما در حال تولید روزانه هزاران داده مختلف هستیم؛ از فعالیتهایی که در شبکههای اجتماعی داریم، تا تراکنشهای بانکی و حتی چک کردن صفحه یک فروشگاه آنلاین. همه این فعالیتها دادههایی را ایجاد میکنند که میتوانند برای کسب و کارها بسیار کارآمد باشند. کسب و کارها برای ارائه خدمات به مشتریان خود به بهترین شکل، نیاز دارند تا این دادهها را جمعآوری کنند و با پاکسازی دادهها و جدا کردن دادههای پرت از دادههای مفید، به اطلاعات و بینش درباره مشتریان خود برسند. اینجا نقطهای است که دیتا ساینس وارد میدان میشود.
دیتا ساینس (Data Science) یا علم داده، همانطور که از اسم آن مشخص است، علمی است که محوریت اصلی آن، پردازش و مطالعه داده برای استخراج اطلاعات و بینشهای ارزشمند برای کسب و کار است. هر کسب و کار برای استفاده از این علم، به فردی نیاز دارد که وظیفه جمعآوری، تجزیه و تحلیل و تجسم داده را دارد. این فرد دانشمند داده یا دیتا ساینتیست (Data Scientist) است.
در این مقاله قصد داریم ابتدا با این مفهوم آشنا شویم و سپس با بررسی تأثیر آن روی زندگی امروزی، آینده دیتا ساینس را بررسی کنیم. همچنین در انتها نگاهی به شغل دانشمند داده یا دیتاساینتیست میاندازیم و یکی از شرکتهای حوزه فین تک (Fintech) را که نقش دانشمندان داده در آن پررنگ است، معرفی میکنیم.
دیتا ساینس یا علم داده چیست؟
دیتا ساینس (Data Science) یا علم داده، یک حوزه شغلی و آکادمیک بینرشتهای است که از ترکیب ریاضیات، آمار و احتمال، محاسبات علمی، برنامه نویسی، تحلیل، هوش مصنوعی، الگوریتمها و سیستمها و … تشکیل شده است. این حوزه در دنیا، به عنوان یکی از حوزههای پرطرفدار و آیندهدار برای متخصصان شناخته شده است.
در سال 1962، زیربنای علم داده با عنوان تحلیل داده (Data Analysis) به جامعه مهندسی و تحلیل معرفی شد؛ اما تا اواخر دهه 90 میلادی، رسما نام دیتا ساینس را به خود نگرفته بود. هدف اصلی دیتا ساینس، تجزیه و تحلیل دادههای کسب و کار و استخراج اطلاعات مفید و بینشهای مخفی در دادهها، برای کمک به تصمیمگیری و برنامهریزیهای کلان سازمان است.
این حوزه از داده و روشهای مختلف پردازش داده استفاده میکند تا به دانش عمیق در یک موضوع برسد. Data Science یک حوزه بسیار جامع است که شامل بسیاری از حوزههای علمی و شغلی دیگر هم میشود؛ مانند هوش مصنوعی (AI)، یادگیری ماشین (Machine Learning)، داده کاوی (دیتا ماینینگ)، هوش تجاری (BI) و ….
دیتا ساینس در دنیای امروز
حجم فزاینده منابع داده، و به طبع آن حجم خود داده، دیتا ساینس را به یکی از حوزههای جذاب، با سرعت رشد بالا تبدیل کرده است. به گفته (HBR (Harvard Business Review دیتا ساینس «جذابترین شغل قرن 21» است. هرچه میگذرد، شرکتها بیشتر و بیشتر به این علم متکی میشوند و برای تحلیل داده و رسیدن به روشهای نوین بهبود کسب و کار، از این علم استفاده میکنند.
با استفاده از دادههای کسب و کار، میتوانید چندین قدم فراتر بروید؛ میتوانید از دادههای گذشته الگو استخراج کنید، با دادههای فعلی خود استراتژیهای مختلف را تست کنید و آینده کسب و کار خود را پیشبینی کنید. علم داده با ترکیب چندین حوزه مختلف، چنان تاثیر عظیمی در ساخت دنیای امروز و آینده دارد، که تبدیل به یکی از پرتقاضاترین رشتههای تحصیلی و عناوین شغلی شده است.
آینده دیتا ساینس
در دنیای امروز، تعداد کسب و کارهایی که بدون استفاده از داده بتواند موفق شود، کم است. همین موضوع هم زمینهساز شکلگیری کسب و کارهای جدید در حوزه خدمات داده، و عناوین شغلی جدید شده است. امروز میتوانید هرکاری را با داده و تحلیل داده ترکیب کنید؛ مثلا بازاریابی داده-محور، طراحی داده-محور، تجزیه و تحلیل داده-محور و … داده تا جایی اهمیت دارد که شما در هر زمینهای هم که فعالیت کنید، آرام آرام به سمت یادگیری این حوزه وسیع و عمیق، سوق داده میشوید.
طبق بررسیهای انجام شده در سطح بینالمللی، تا چند سال آینده همه چیز بر مبنای داده پیش خواهد رفت. به گفته هال واریان (Hal Varian)، استاد اقتصاد، کسب و کار و علوم ارتباطات دانشگاه برکلی:
«توانایی جمعآوری، درک، پردازش، استخراج ارزش، تصویرسازی و انتقال داده، یکی از مهارتهای بسیار مهم در دهههای آینده خواهد بود.»
بنابراین میتوانیم بگوییم که علم داده، یک حوزه پرتقاضا در آینده خواهد بود که لازمه ورود به بازار کار و موفقیت در این رشته، داشتن مهارتهای کامل در زمینه جمعآوری، پردازش، تصویرسازی و به طور کلی استفاده مؤثر از داده است.
دیتاساینتیست یا دانشمند داده
مفهوم دیتا ساینتیست (Data Scientist) در سال 2008 مطرح شد؛ زمانی که شرکتها با نیاز خود به متخصصهای حوزه داده، که مهارت مدیریت و تحلیل دادههای کلان را داشتند، روبهرو شدند. در دهه گذشته، دانشمندان داده به یک ارزش افزوده مهم برای شرکتها تبدیل شدهاند و تقریباً در هر شرکتی که لزوم استفاده از داده را درک کرده باشد، حضور دارند.
متخصصهای داده افراد توانمند و داده-محوری هستند، که سطح بالایی از مهارتهای فنی دارند و میتوانند با استفاده از الگوریتمها پیچیده کمّی، اطلاعات به دست آمده از داده را برای پاسخ به سؤالات و تدوین استراتژی کسب و کار، مدیریت و ترکیب کنند. این تواناییها در کنار توانایی ارتباط و رهبری، برای انتقال موضوعات مختلف به ذینفعان کسب و کار، به کمک دانشمندان داده میآید.
یک دانشمند داده باید مهارتهای فنی زیر را در خود داشته باشد و تقویت کند:
- برنامهنویسی با زبانهای R, Python, Apache و …
- تسلط به پایگاهداده (Database)
- تسلط به رایانش ابری (Cloud Computing)
- تسلط به ابزارهای Tableau, GitHub و …
- تسلط به کتابخانههای زبانهای مختلف
- آشنایی با هوش مصنوعی، یادگیری ماشین، داده کاوی و …
علاوهبر مهارتهای بالا، مهارتهای فردی شامل ارتباط مؤثر، توانایی مدیریت و رهبری، توانایی تجزیه و تحلیل و … هم از مهارتهای اساسی یک دیتا ساینتیست هستند.
کلام آخر
دیتا ساینس یک حوزه گسترده با عمق زیاد است. ورود به این حوزه هم مستلزم داشتن مهارتهای فنی و ارتباطی مختلف است که در مراحل مختلف به کمک فرد میآیند. با توجه به افزایش روزافزون حجم داده در دنیا، نیاز به افراد خبره در زمینه علم داده و هوش مصنوعی، به طور فزایندهای افزایش مییابد.
در ایران هم شرکتهای مختلفی هستند که نیاز به این متخصصان را به خوبی درک کردهاند. شرکت ویستا سامانه آسا یکی از شرکتهای فعال در حوزه فناوریهای مالی، پول و بازار سرمایه است. این شرکت که زیر مجموعه گروه مالی آگاه است، یک مثال مناسب از درک نیاز به دیتا ساینس در کسب و کار است. در ویستا سامانه آسا، بخشهای فنی مختلفی وجود دارند، اما یکی از پررنگترین این بخشها، بخش هوش تجاری است. هوش تجاری یکی از حوزههایی است که ارتباط تنگاتنگی با داده و دیتا ساینس دارد و بهعبارتی، تجسم عینی دیتا ساینس در کسب و کار است.