مقایسه دیتاساینس در دانشگاه و صنعت – شباهتها و تفاوتها
برای کسانی که با فرآیند تحقیقات دانشگاهی و کاربرد علم داده در این زمینه آشنا نیستند، من علم داده را به عنوان فرآیند هدایت بینش از داده ها با استفاده از روش ها و الگوریتم های علمی تعریف می کنم. به عنوان مثال، من عمدتاً از روشهای استنتاج علی و یادگیری ماشین برای پاسخ به سؤالات تحقیق در پروژههای پایاننامه استفاده میکنم.
در دانشگاه، ما باید سؤالات مرتبطی را پیدا کنیم که پاسخ آنها را تضمین کند (به عنوان مثال، چگونه روشهای پرداخت بر درآمد تأثیر می گذارد یا چگونه کمپین های خاص بر فروش تأثیر می گذارد). سپس دادههای مورد نیاز برای پاسخ به این سؤالات را جمعآوری میکنیم (مثلاً با همکاری با یک روزنامه آنلاین، حذف وب، استفاده از APIها یا تهیه دادهها). هنگامی که داده ها را در اختیار داریم، می توانیم فرآیند آماده سازی داده ها را برای تجزیه و تحلیل آغاز کنیم و از داده ها برای آزمون فرضیه های خود استفاده کنیم. هنگامی که برخی از نتایج اولیه را به دست آوردیم، از طریق ارائه ها و پیش نویس مقالات برای دریافت بازخورد، با آنها ارتباط برقرار می کنیم. ما تحلیل ها، ارائه ها و مقالات را به روز می کنیم تا به بازخوردهای دریافتی رسیدگی کنیم. این فرآیند (یعنی دریافت بازخورد، آدرس دادن به بازخورد) تکرار می شود تا زمانی که به پروژه/مقاله با کیفیتی برسیم که نوار علمی را پاک کند.
اکنون که میدانیم علم داده چگونه زیربنای فرآیند تحقیقات دانشگاهی را مهیا میکند، اجازه دهید برخی از جنبههای کلیدی را بررسی کنیم که ارزش بحث در هنگام مقایسه علم داده در دانشگاه و صنعت را دارد.
اهداف و تعریف تاثیر
اهداف علم داده در دانشگاه و صنعت، اگرچه هر دو ارزشمند هستند، اما حوزههای تمرکز متمایز و در نتیجه، تعاریف متفاوتی از تأثیر دارند. در دانشگاه، هدف اصلی اغلب پیشرفت دانش است. هدف محققان پر کردن شکافها در درک فعلی، به چالش کشیدن نظریههای موجود، یا توسعه چارچوبها، روششناسی یا ابزارهای جدید است. تأثیر در اینجا تا حد زیادی با تأثیر کار آنها بر جامعه دانشگاهی اندازه گیری می شود، همانطور که از طریق نقل قول ها، پیشرفت ها در این زمینه، و مشارکت در آموزش و یادگیری دیده می شود.
در صنعت، اهداف علم داده معمولاً مستقیماً با اهداف تجاری مانند بهبود عملیات، بهینه سازی محصولات یا خدمات و کمک به تصمیم گیری استراتژیک مرتبط هستند. این تأثیر اغلب بر حسب نتایج ملموس مانند افزایش تجربه کاربر، افزایش درآمد، صرفه جویی در هزینه یا سایر شاخص های کلیدی عملکرد مرتبط با کسب و کار ارزیابی می شود. این بدان معنا نیست که کار در صنعت صرفاً معاملاتی است. بسیاری از پروژه های صنعتی همچنین به اهداف اجتماعی گسترده تر، مانند بهبود مراقبت های بهداشتی، پیشرفت شیوه های پایدار، یا افزایش حریم خصوصی و امنیت داده ها کمک می کنند.
در هر دو بخش، هدف نهایی ایجاد ارزش است، اما نحوه تعریف و اندازه گیری آن ارزش می تواند به طور قابل توجهی متفاوت باشد. شناخت این تفاوت ها می تواند به ما کمک کند تا از کمک های منحصر به فرد علم داده در دانشگاه و صنعت قدردانی کنیم.
تدوین سوالات تحقیق و جمع آوری داده ها
در دانشگاه، ایجاد سؤالات پژوهشی و وظیفه جمع آوری داده ها معمولاً بخشی ذاتی از نقش یک محقق است. انگیزه توسعه و پاسخ به سؤالات توسط کنجکاوی فکری، شکاف در دانش موجود، و پتانسیل کمک به بینش های جدید به درک جمعی ما هدایت می شود. این فرآیند میتواند زمانبر و زمانبر باشد، زیرا ممکن است شامل بررسی ادبیات گسترده، آزمایش، بررسیها یا کار میدانی باشد.
در مقابل، در محیط صنعت، منشأ پرسشها و دادههای تحقیق اغلب به شکل متفاوتی است. سؤالات معمولاً از نیازهای خاص کسب و کار به دست میآیند تا بینشهایی را به دست آورند که عملیات، محصولات یا خدمات را بهبود بخشد. دانشمندان داده در صنعت معمولاً با داده هایی کار می کنند که به راحتی در دسترس هستند – محصول جانبی فعالیت های تجاری یا تهیه شده از ارائه دهندگان شخص ثالث.
با این حال، این قوانین سختگیرانه نیستند و ممکن است در هر دو بخش تغییرات کمی وجود داشته باشد. هم در دانشگاه و هم در صنعت، توانایی فرمولبندی سوالات معنادار و درک کیفیت و تناسب دادهها، مهارتهای حیاتی برای یک دانشمند داده است.
جدول زمانی و محدوده پروژه ها
هر دو پروژه دانشگاهی و صنعتی دارای جدول زمانی و محدوده منحصر به فرد خود هستند که با اهداف خاص آنها هماهنگ است. تحقیقات آکادمیک به دلیل ماهیت دقیق جمعآوری دادهها، تجزیه و تحلیل دقیق (مثلاً بررسیهای قوی)، بررسیهای همتایان، و فرآیندهای انتشار ذاتی در دانشگاه، اغلب از یک جدول زمانی طولانیتر پیروی میکنند. به عنوان محقق، هدف ما افزودن به مخزن دانش علمی از طریق نتایج قوی و کاملاً تأیید شده است، فرآیندی که طبیعتاً به زمان نیاز دارد.
با این حال، در یک محیط صنعتی، جدول زمانی کوتاهتر در پاسخ به ماهیت پویای بازار و نیازهای تجاری است. این به این معنی نیست که کیفیت به خطر افتاده است. برعکس، صنعت همچنین از فرآیندهای کنترل کیفیت دقیق برای اطمینان از قابلیت اطمینان نتایج پیروی می کند. این سرعت با هدف ارائه سریع بینش های عملی برای حفظ یا به دست آوردن مزیت رقابتی هدایت می شود. این چابکی به شرکتها اجازه میدهد تا به سرعت خود را تطبیق دهند و نوآوری کنند، که یک نقطه قوت در محیط تجاری سریع است.
تفکر انتقادی و علمی
تفکر انتقادی و علمی هم در دانشگاه و هم در علم داده بسیار ارزشمند است. برای مثال، آزمایش فرضیه، هسته اصلی فرآیند علمی در دانشگاه و مسیر استنتاج علّی علم دادههای صنعت (به عنوان مثال، آزمایشها) است. توانایی فرمولبندی سؤالات خوب، تأیید پاسخها و ارزیابی انتقادی استدلالها، مهارتهایی هستند که در هر دو حوزه مورد احترام هستند.
ارتباط و همکاری
یک مهارت حیاتی در هر دو بخش، ماهیت ارتباط، بسته به مخاطب متفاوت است. در دانشگاه، ما با محققین، اساتید، دانشجویان یا سهامداران صنعت ارتباط برقرار می کنیم، در حالی که در صنعت، دانشمندان داده با طیف وسیع تری از ذینفعان، از جمله سایر دانشمندان داده، مدیران، مدیران اجرایی یا مشتریان ارتباط برقرار می کنند. مهارت در ساده سازی ایده های پیچیده برای گروه های غیرتخصصی یک شرط رایج است.
این تصور غلط وجود دارد که دانشجویان دکترا به دلیل تخصص عمیق خود فاقد مهارت های ارتباطی هستند و به طور بالقوه برای توضیح ایده های پیچیده به زبانی ساده و قابل دسترس برای افراد غیرمتخصص یا ذینفعان تجاری مشکل دارند. با این حال، این اساساً نادرست است. موفقیت در دانشگاه به توانایی برقراری ارتباط موثر با مخاطبان مختلف بستگی دارد. به عنوان مثال، من به طور مرتب نیاز به برقراری ارتباط با افراد با زمینه های مختلف مانند محققان رشته خود، محققان سایر رشته ها، دانشجویان و افرادی از صنعت دارم. برای هر یک از این گروهها یا ترکیبی از این گروهها، من ارتباط متفاوتی برقرار میکنم.
مدیریت داده ها و شیوه های کدگذاری خوب
با ظهور داده های بزرگ، محققان دانشگاهی و صنعتی با پردازش مجموعه داده های بزرگ و خطوط لوله داده پیچیده دست و پنجه نرم می کنند. اگرچه ابزارهای خاص مورد استفاده ممکن است متفاوت باشند، اصول شیوه های کدگذاری خوب، مستندسازی دقیق و مدیریت کارآمد داده ها هم برای صنعت و هم برای دانشگاه عمومی هستند. در دانشگاه، این اصول پایه و اساس علم بازتولیدپذیر و باز را تشکیل می دهند. بنابراین، بسیاری از محققین این اصول را اجرا میکنند تا علم را شفافتر، در دسترستر، مشارکتیتر و تکرارپذیرتر کنند.
مدیریت پروژه
مهارتهای مدیریت پروژه و اولویتبندی مؤثر در دانشگاه و صنعت، علیرغم برداشتهای متفاوت، حیاتی است. این تصور که زمانبندی طولانیتر در دانشگاه از اهمیت مدیریت پروژه میکاهد، در واقع یک تصور اشتباه است. در دانشگاه، دانش پژوهان اغلب مجموعه متنوعی از مسئولیتها، از جمله تدریس، راهنمایی و مدیریت را در کنار پروژههای تحقیقاتی پیچیده متعادل میکنند. هر مرحله از تحقیق نیاز به برنامه ریزی دقیق و مدیریت کار کارآمد دارد که بر نیاز به مهارت های قوی مدیریت پروژه تاکید دارد.
به طور مشابه، در صنعت، برنامه ریزی دقیق، هماهنگی و اجرا در تمام مراحل پروژه های علم داده بسیار مهم است. سرعت سریع صنعت، پروژههای متعدد همزمان و تقاضا برای بینشهای سریع و عملی بر اهمیت مدیریت پروژه اثربخش تأکید میکند. علیرغم تفاوتها در زمانبندی و زمینه، نیاز به مدیریت موفق پروژه در هر دو بخش بسیار مهم است و نه تنها از تکمیل به موقع، بلکه کیفیت کار و بهرهوری منابع نیز تضمین میشود.
مهارت های نرم
استقلال، انضباط شخصی، همکاری موثر و مهارت های سازمانی قوی مهم هستند، چه قصد انتشار مقاله یا ارائه یک پروژه تجاری موفق را داشته باشید. این مهارت ها ممکن است یکی از مهم ترین چیزهایی باشد که در طول دوره دکتری ام آموختم. مهم این است که بتوانیم به صورت مستقل و در عین حال مشارکتی کار کنیم.
برای پروژههایم، باید بتوانم ایدههایی ارائه کنم، مشکلات را حل کنم، و کارهای دیگر را مستقل انجام دهم، اما در عین حال، باید با همکارانم (نویسندگان همکار) همگام باشیم. من یاد گرفته ام که ارتباط موثر چقدر مهم است، به ویژه زمانی که همکاران شما از پیشینه ها و فرهنگ های مختلف هستند. مهارت دیگری که فرد برای همکاری موثر ایجاد می کند، توانایی گرفتن، قدردانی و اجرای بازخورد است. این مهارت ها برای نقش های صنعتی نیز حیاتی هستند.
یادگیری و سازگاری
هم دانشگاه و هم صنعت نیازمند تعهد مداوم به یادگیری و سازگاری، همگامی با روشها و فناوریهای در حال تحول هستند. در دانشگاه، همانطور که در صنعت وجود دارد، نمی توانید هیچ ابزار مفید جدیدی را نادیده بگیرید تا مزیت رقابتی خود را از دست ندهید.
به عنوان مثال، زمانی که من اولین دوره دکتری خود را می گذراندم. پروژه و با استفاده از یک روش آماری دقیق مورد استفاده در دانشگاه و صنعت. با این حال، بسیاری از تحقیقات جدید منتشر شده است که نشان می دهد در شرایط خاص این روش به خوبی عمل نمی کند. من در نهایت خودم را در مورد مسائلی که پیش میآید و راهحلهای جدید بالقوه برای این مسائل آموزش میدادم.
مهارتهای فنی
دانشمندان داده در دانشگاه و صنعت باید بر مجموعه ای از ابزارهای فنی تسلط داشته باشند. زبان هایی مانند پایتون و R در هر دو حوزه برای کارهای علم داده گسترده هستند. با این حال، ابزارهایی مانند SQL، Spark و Tableau ممکن است در محافل صنعتی در مقایسه با دانشگاهها استفاده مکررتری داشته باشند.
نتیجه گیری
این کاوش تقابل علم داده در دانشگاه و صنعت را بررسی کرد و شباهتهای بیشتری از آنچه در ابتدا پیش بینی می کردم را آشکار می کند. بسیاری از محققان دانشگاهی دریافته اند که سوابق آنها پایه و اساس محکمی برای ایفای نقش در صنعت فراهم می کند. آموزشهای آموزشی و فنی آنها را قادر میسازد تا به راحتی روشهای جدید را درک کنند، در حالی که تجربه آنها در ارتباطات، حل مسئله، تحقیقات مستقل و همکاری، مجموعهای از مهارتهای قوی را برای آنها فراهم میکند که میتواند در زمینه صنعت به کار رود.
با تشکر از شما برای خواندن این مطلب!
سلب مسئولیت : من برای یادگیری می نویسم. اگر احیانا خطایی در این مطلب پیدا کردید، لطفا به من اطلاع دهید.