آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد؟

آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد؟

پاسخ کوتاه: هوش مصنوعی به طور کامل جایگزین مهندسان داده نخواهد شد؛ بلکه کارهای تکراری مانند تهیه پیش‌نویس SQL، چارچوب‌بندی پایپ‌لاین، آزمایش‌ها و مستندسازی را خودکار خواهد کرد. اگر نقش شما عمدتاً کار با مالکیت کم و تیکت‌محور است، بیشتر در معرض خطر قرار دارد؛ اگر قابلیت اطمینان، تعاریف، حاکمیت و پاسخ به حوادث را در اختیار دارید، هوش مصنوعی عمدتاً شما را سریع‌تر می‌کند.

نکات کلیدی:

مالکیت : پاسخگویی در قبال نتایج را در اولویت قرار دهید، نه فقط تولید سریع کد.

کیفیت : تست‌ها، قابلیت مشاهده و قراردادها را بسازید تا خطوط لوله قابل اعتماد باقی بمانند.

مدیریت : حریم خصوصی، کنترل دسترسی، نگهداری و ردیابی‌های حسابرسی را در مالکیت انسان نگه دارید.

مقاومت در برابر سوء استفاده : خروجی‌های هوش مصنوعی را به عنوان پیش‌نویس در نظر بگیرید؛ آنها را بررسی کنید تا از اشتباه‌های بی‌مورد جلوگیری شود.

تغییر نقش : زمان کمتری را صرف تایپ کردن مطالب تکراری و زمان بیشتری را صرف طراحی سیستم‌های بادوام کنید.

آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد؟ اینفوگرافیک

اگر بیش از پنج دقیقه در تیم‌های داده وقت گذرانده باشید، این جمله را شنیده‌اید - که گاهی زمزمه می‌شود، و گاهی مانند یک پیچش داستانی در طول جلسه مطرح می‌شود: آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد؟

و... می‌فهمم. هوش مصنوعی می‌تواند SQL تولید کند، خطوط لوله بسازد، ردیابی پشته را توضیح دهد، مدل‌های dbt را پیش‌نویس کند، حتی با اطمینان نگران‌کننده‌ای طرح‌های انبار را پیشنهاد دهد. GitHub Copilot برای SQL درباره مدل‌های dbt GitHub Copilot
مثل این است که به یک لیفتراک نگاه کنید که در حال یادگیری تردستی است. چشمگیر، کمی نگران‌کننده، و شما کاملاً مطمئن نیستید که این برای شغل شما چه معنایی دارد 😅

اما حقیقت به اندازه تیتر مرتب و تمیز نیست. هوش مصنوعی کاملاً در حال تغییر مهندسی داده‌ها است. بخش‌های کسل‌کننده و تکراری را خودکار می‌کند. لحظه‌های «می‌دانم چه می‌خواهم اما نمی‌توانم نحو را به خاطر بیاورم» را سرعت می‌بخشد. همچنین انواع جدیدی از هرج و مرج را ایجاد می‌کند.

پس بیایید آن را به درستی طرح کنیم، بدون خوش‌بینیِ دست و پا چلفتی یا وحشتِ نابودی.

مقالاتی که شاید بعد از این مطلب دوست داشته باشید بخوانید:

🔗 آیا هوش مصنوعی جایگزین رادیولوژیست‌ها خواهد شد؟
چگونه هوش مصنوعی تصویربرداری، گردش کار، دقت و نقش‌های آینده را تغییر می‌دهد.

🔗 آیا هوش مصنوعی جایگزین حسابداران خواهد شد؟
ببینید کدام وظایف حسابداری توسط هوش مصنوعی خودکارسازی می‌شوند و کدام وظایف توسط انسان انجام می‌شوند.

🔗 آیا هوش مصنوعی جایگزین بانکداران سرمایه‌گذاری خواهد شد؟
تأثیر هوش مصنوعی را بر معاملات، تحقیقات و روابط با مشتری درک کنید.

🔗 آیا هوش مصنوعی جایگزین نمایندگان بیمه خواهد شد؟
بیاموزید که چگونه هوش مصنوعی، بیمه گری، فروش و پشتیبانی مشتری را متحول می‌کند.


چرا سوال «هوش مصنوعی جایگزین مهندسان داده می‌شود» مدام مطرح می‌شود 😬

این ترس از یک جای بسیار خاص ناشی می‌شود: مهندسی داده کارهای تکراری زیادی دارد .

  • نوشتن و بازسازی SQL

  • ساخت اسکریپت‌های مصرف

  • نگاشت فیلدها از یک طرحواره به طرحواره دیگر

  • ایجاد تست‌ها و مستندات اولیه

  • اشکال‌زدایی از خطاهای خط لوله که ... تا حدودی قابل پیش‌بینی هستند

هوش مصنوعی به طور غیرمعمولی در الگوهای تکرارپذیر خوب است. و بخش بزرگی از مهندسی داده دقیقاً همین است - الگوهایی که روی هم انباشته می‌شوند. پیشنهادات کد GitHub Copilot

همچنین، اکوسیستم ابزارها از قبل پیچیدگی را «پنهان» کرده است:

بنابراین وقتی هوش مصنوعی ظاهر می‌شود، می‌تواند مانند آخرین قطعه احساس شود. اگر پشته از قبل انتزاعی شده باشد و هوش مصنوعی بتواند کد چسب را بنویسد... چه چیزی باقی می‌ماند؟ 🤷

اما نکته‌ای که مردم از آن غافل می‌شوند این است: مهندسی داده عمدتاً تایپ کردن نیست . تایپ کردن بخش آسان آن است. بخش سخت آن، وادار کردن واقعیت مبهم، سیاسی و متغیر کسب‌وکار به رفتاری قابل اعتماد است.

و هوش مصنوعی هنوز با آن تاریکی دست و پنجه نرم می‌کند. انسان‌ها هم در این مشکل دست و پنجه نرم می‌کنند - آنها فقط بداهه‌پردازی بهتری انجام می‌دهند.


کاری که مهندسان داده واقعاً تمام روز انجام می‌دهند (حقیقت ناخوشایند) 🧱

بیایید رک باشیم - عنوان شغلی «مهندس داده» مثل این است که شما از ریاضی محض موتور موشک بسازید. در عمل، شما در حال ایجاد اعتماد .

یک روز معمولی کمتر درگیر «اختراع الگوریتم‌های جدید» و بیشتر درگیر موارد زیر است:

  • مذاکره با تیم‌های بالادستی در مورد تعاریف داده‌ها (دردناک اما ضروری)

  • بررسی دلیل تغییر یک معیار (و اینکه آیا این تغییر واقعی است)

  • مدیریت رانش طرحواره و غافلگیری‌های «کسی نیمه‌شب یک ستون اضافه کرد»

  • اطمینان از اینکه خطوط لوله، خود-توان، قابل بازیابی و قابل مشاهده هستند

  • ایجاد گاردریل‌هایی برای جلوگیری از اشتباه تحلیلگران پایین‌دستی در ساخت داشبوردهای بی‌معنی

  • مدیریت هزینه‌ها تا انبار شما به آتش پول تبدیل نشود 🔥

  • ایمن‌سازی دسترسی، حسابرسی، انطباق، سیاست‌های نگهداری اصول GDPR (کمیسیون اروپا) محدودیت ذخیره‌سازی (ICO)

  • ساخت محصولات داده‌ای که مردم بتوانند بدون پیام دادن به شما از آنها استفاده کنند - 20 سوال

بخش بزرگی از این شغل، اجتماعی و عملیاتی است:

  • «این میز مال کیست؟»

  • «آیا این تعریف هنوز معتبر است؟»

  • «چرا CRM داده‌های تکراری را صادر می‌کند؟»

  • «می‌تونیم این معیار رو بدون خجالت به مدیران اجرایی منتقل کنیم؟» 😭

مطمئناً هوش مصنوعی می‌تواند در بخش‌هایی از این امر کمک کند. اما جایگزینی کامل آن ... یک کار طاقت‌فرسا است.


چه چیزی یک نسخه قوی از نقش مهندسی داده را می‌سازد؟ ✅

این بخش اهمیت دارد زیرا صحبت‌های مربوط به جایگزینی معمولاً فرض را بر این می‌گذارد که مهندسان داده عمدتاً «سازندگان خطوط لوله» هستند. این مثل این است که فرض کنیم سرآشپزها عمدتاً «سبزی خرد می‌کنند». این بخشی از کار است، اما خودِ شغل نیست.

یک نسخه قوی از یک مهندس داده معمولاً به این معنی است که آنها می‌توانند اکثر این موارد را انجام دهند:

  • طراحی برای تغییر
    داده‌ها تغییر می‌کنند. تیم‌ها تغییر می‌کنند. ابزارها تغییر می‌کنند. یک مهندس خوب سیستم‌هایی می‌سازد که هر بار واقعیت عطسه می‌کند، از هم نمی‌پاشند 🤧

  • تعریف قراردادها و انتظارات
    «مشتری» به چه معناست؟ «فعال» به چه معناست؟ وقتی یک ردیف دیر می‌رسد چه اتفاقی می‌افتد؟ قراردادها بیشتر از کدهای پیچیده از هرج و مرج جلوگیری می‌کنند. استاندارد قرارداد داده باز (ODCS) ODCS (GitHub)

  • قابلیت مشاهده را در همه چیز بگنجانید
    نه فقط «آیا اجرا شد» بلکه «آیا به درستی اجرا شد». تازگی، ناهنجاری‌های حجم، انفجارهای تهی، تغییرات توزیع. قابلیت مشاهده داده‌ها (Dynatrace) قابلیت مشاهده داده‌ها چیست؟

  • مثل یک بزرگسال،
    بین سرعت در مقابل صحت، هزینه در مقابل تأخیر، انعطاف‌پذیری در مقابل سادگی، تعادل برقرار کنید. هیچ خط لوله بی‌نقصی وجود ندارد، فقط خطوط لوله‌ای وجود دارند که می‌توانید با آنها کنار بیایید.

  • نیازهای تجاری را به سیستم‌های بادوام تبدیل کنید.
    مردم معیارها را درخواست می‌کنند، اما آنچه نیاز دارند یک محصول داده‌ای است. هوش مصنوعی می‌تواند کد را تهیه کند، اما نمی‌تواند به طور جادویی مین‌های زمینی تجاری را بشناسد.

  • داده‌ها را ساکت نگه دارید.
    بالاترین تعریف برای یک پلتفرم داده این است که هیچ‌کس در مورد آن صحبت نکند. داده‌های بی‌وقفه، داده‌های خوبی هستند. مثل لوله‌کشی. فقط وقتی متوجه آنها می‌شوید که از کار می‌افتند 🚽

اگر این کارها را انجام می‌دهید، سوال «آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد؟» کمی بی‌ربط به نظر می‌رسد. هوش مصنوعی می‌تواند جایگزین وظایف ، نه مالکیت .


جایی که هوش مصنوعی همین الان هم به مهندسان داده کمک می‌کند (و واقعاً عالی است) 🤖✨

هوش مصنوعی فقط بازاریابی نیست. اگر به خوبی استفاده شود، یک نیروی فزاینده‌ی مشروع است.

۱) SQL و کار تبدیل سریع‌تر

  • ترسیم اتصالات پیچیده

  • نوشتن توابع پنجره‌ای که ترجیح می‌دهید به آنها فکر نکنید

  • تبدیل منطق زبان ساده به اسکلت‌های پرس‌وجو

  • بازسازی کوئری‌های زشت به CTEهای خوانا در GitHub Copilot برای SQL

این خیلی مهم است زیرا اثر «صفحه خالی» را کاهش می‌دهد. شما هنوز هم نیاز به اعتبارسنجی دارید، اما به جای ۰٪ از ۷۰٪ شروع می‌کنید.

۲) اشکال‌زدایی و ریشه‌یابی علت خطا در breadcrumbs

هوش مصنوعی در موارد زیر عملکرد مناسبی دارد:

  • توضیح پیام‌های خطا

  • پیشنهاد دادن که کجا را جستجو کنیم

  • توصیه مراحل تایپ «بررسی عدم تطابق طرحواره» GitHub Copilot
    مثل این است که یک مهندس جوان خستگی‌ناپذیر داشته باشید که هرگز نمی‌خوابد و گاهی اوقات با اطمینان دروغ می‌گوید 😅

۳) مستندسازی و غنی‌سازی کاتالوگ داده‌ها

تولید خودکار:

  • توضیحات ستون

  • خلاصه مدل‌ها

  • توضیحات دودمان

  • اسناد dbt با عنوان «این جدول برای چه کاری استفاده می‌شود؟»

بی‌نقص نیست، اما نفرین خطوط لوله‌ی مستند نشده را می‌شکند.

۴) داربست‌ها را آزمایش و بررسی کنید

هوش مصنوعی می‌تواند پیشنهاد دهد:

باز هم - شما هنوز تصمیم می‌گیرید که چه چیزی مهم است، اما این کار بخش‌های روتین را سرعت می‌بخشد.

۵) کد «چسب» خط لوله

قالب‌های پیکربندی، چارچوب‌های YAML، پیش‌نویس‌های DAG برای تنظیم و هماهنگ‌سازی. این چیزها تکراری هستند و هوش مصنوعی هم چیزهای تکراری را به عنوان صبحانه می‌خورد 🥣 DAGهای Apache Airflow


جایی که هوش مصنوعی هنوز در حال تقلا است (و این هسته اصلی آن است) 🧠🧩

این بخشی است که بیشترین اهمیت را دارد، زیرا به سوال جایگزینی با بافت واقعی پاسخ می‌دهد.

۱) ابهام و تغییر تعاریف

منطق کسب‌وکار به ندرت واضح است. مردم در اواسط جمله نظرشان را عوض می‌کنند. «کاربر فعال» تبدیل می‌شود به «کاربر فعال پرداخت‌کننده» تبدیل می‌شود به «کاربر فعال پرداخت‌کننده، به جز گاهی اوقات، بدون بازپرداخت»... می‌دانید که قضیه از چه قرار است.

هوش مصنوعی نمی‌تواند این ابهام را بپذیرد. فقط می‌تواند حدس بزند.

۲) پاسخگویی و ریسک

وقتی یک خط لوله خراب می‌شود و داشبورد اجرایی اطلاعات بی‌معنی نشان می‌دهد، یک نفر باید:

  • تریاژ

  • تأثیر ارتباط

  • آن را درست کن

  • جلوگیری از عود

  • کالبدشکافی را بنویسید

  • تصمیم بگیرید که آیا کسب و کار هنوز می‌تواند به اعداد هفته گذشته اعتماد کند یا خیر

هوش مصنوعی می‌تواند کمک کند، اما نمی‌تواند به شیوه‌ای معنادار پاسخگو باشد. سازمان‌ها بر اساس ارتعاشات اداره نمی‌شوند - آنها بر اساس مسئولیت اداره می‌شوند.

۳) تفکر سیستمی

پلتفرم‌های داده، اکوسیستم‌هایی هستند: دریافت، ذخیره‌سازی، تبدیل، هماهنگ‌سازی، مدیریت، کنترل هزینه، توافق‌نامه سطح خدمات (SLA). تغییر در یک لایه، موج‌هایی را به دنبال دارد. مفاهیم آپاچی ایرفلو

هوش مصنوعی می‌تواند بهینه‌سازی‌های محلی را پیشنهاد دهد که باعث ایجاد درد جهانی می‌شود. مثل این است که با برداشتن در، صدای جیرجیر آن را درست کنید 😬

۴) امنیت، حریم خصوصی، انطباق

اینجاست که خیال‌پردازی‌های جایگزین به پایان می‌رسند.

هوش مصنوعی می‌تواند سیاست‌ها را تدوین کند، اما اجرای ایمن آنها یک مهندسی واقعی است.

۵) «ناشناخته‌های ناشناخته»

حوادث داده‌ای اغلب غیرقابل پیش‌بینی هستند:

  • یک API فروشنده، معناشناسی را بی‌سروصدا تغییر می‌دهد

  • یک فرض منطقه زمانی برعکس می‌شود

  • یک backfill یک پارتیشن را کپی می‌کند

  • مکانیسم تلاش مجدد باعث نوشتن مضاعف می‌شود

  • یک ویژگی جدید محصول، الگوهای رویداد جدیدی را معرفی می‌کند

هوش مصنوعی وقتی که موقعیت یک الگوی شناخته‌شده نباشد، ضعیف‌تر است.


جدول مقایسه: در عمل چه چیزی چه چیزی را کاهش می‌دهد 🧾🤔

در زیر یک دیدگاه عملی ارائه شده است. منظور «ابزارهایی که جایگزین انسان‌ها می‌شوند» نیست، بلکه ابزارها و رویکردهایی هستند که وظایف خاصی را کوچک‌تر می‌کنند.

ابزار / رویکرد مخاطب حس و حال قیمت چرا کار می‌کند؟
کمک خلبانان کد هوش مصنوعی (کمک کننده‌های SQL + Python) گیت‌هاب کمک خلبان مهندسانی که کد زیادی می‌نویسند از رایگان تا پولی در scaffolding، refactors، syntax عالی است... گاهی اوقات به شکلی بسیار خاص از خود راضی است
کانکتورهای ELT مدیریت‌شده Fivetran تیم‌ها از ساختن ingestion خسته شده‌اند اشتراک-y درد ناشی از بلعیدن سفارشی را از بین می‌برد، اما به روش‌های جدید و سرگرم‌کننده‌ای آن را تسکین می‌دهد
پلتفرم‌های مشاهده‌پذیری داده‌ها مشاهده‌پذیری داده‌ها (Dynatrace) هر کسی که دارای SLA است متوسط ​​تا سازمانی ناهنجاری‌ها را زود تشخیص می‌دهد - مانند آلارم‌های دود برای خطوط لوله 🔔
چارچوب‌های تبدیل (مدل‌سازی اعلانی) dbt هیبریدهای تحلیلی + DE معمولاً ابزار + محاسبه منطق را ماژولار و قابل آزمایش می‌کند، و اسپاگتی کمتری ارائه می‌دهد
کاتالوگ‌های داده + لایه‌های معنایی لایه معنایی dbt سازمان‌هایی با سردرگمی متریک بستگی دارد، در عمل یک بار «حقیقت» را تعریف می‌کند - بحث‌های بی‌پایان در مورد معیارها را کاهش می‌دهد
هماهنگی با قالب‌ها Apache Airflow تیم‌های پلتفرم‌گرا هزینه عملیات + باز شدن گردش‌های کاری را استاندارد می‌کند؛ DAGهای دانه برفی کمتری ایجاد می‌کند
تولید اسناد dbt با کمک هوش مصنوعی تیم‌هایی که از نوشتن مستندات متنفرند ارزان تا متوسط مستندهای «به اندازه کافی خوب» می‌سازد تا دانش از بین نرود
سیاست‌های حاکمیت خودکار چارچوب حریم خصوصی NIST محیط‌های تنظیم‌شده سازمانی-y به اجرای قوانین کمک می‌کند - اما هنوز برای طراحی قوانین به انسان نیاز دارد

توجه کنید چه چیزی کم است: ردیفی که می‌گوید «برای حذف مهندسان داده، دکمه را فشار دهید». بله… آن ردیف وجود ندارد 🙃


خب… آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد یا فقط نقش آنها را تغییر خواهد داد؟ 🛠️

پاسخ غیر نمایشی این است: هوش مصنوعی جایگزین بخش‌هایی از گردش کار خواهد شد، نه خود حرفه.

اما این می‌دهد . و اگر آن را نادیده بگیرید، فشار را احساس خواهید کرد.

چه چیزهایی تغییر می‌کند:

  • زمان کمتر برای نوشتن کدهای تکراری

  • زمان کمتر برای جستجوی اسناد

  • زمان بیشتر برای بررسی، اعتبارسنجی، طراحی

  • زمان بیشتر برای تعریف قراردادها و انتظارات کیفی، استاندارد قرارداد داده باز (ODCS)

  • زمان بیشتر برای همکاری با محصولات، امنیت و امور مالی

این یک تغییر ظریف است: مهندسی داده کمتر به «ساخت خطوط لوله» و بیشتر به «ساخت یک سیستم محصول داده قابل اعتماد» تبدیل می‌شود

و در یک چرخش آرام، این ارزشمندتر است، نه کمتر.

همچنین - و من این را می‌گویم حتی اگر دراماتیک به نظر برسد - هوش مصنوعی تعداد افرادی را که می‌توانند مصنوعات داده‌ای تولید کنند افزایش می‌دهد ، که این امر نیاز به کسی را برای حفظ سلامت کل ماجرا افزایش می‌دهد. خروجی بیشتر به معنای سردرگمی بیشتر است. GitHub Copilot

مثل اینه که به همه یه دریل برقی بدی. عالیه! حالا یکی باید قانون «لطفا لوله آب رو سوراخ نکن» رو اجرا کنه 🪠


مهارت‌های جدیدی که همچنان ارزشمند هستند (حتی با وجود هوش مصنوعی در همه جا) 🧠⚙️

اگر یک چک لیست کاربردی و «مقاوم در برابر آینده» می‌خواهید، به این شکل است:

طرز فکر طراحی سیستم

  • مدل‌سازی داده‌هایی که از تغییر جان سالم به در می‌برند

  • بده‌بستان‌های دسته‌ای در مقابل پخش جریانی

  • تفکر تأخیر، هزینه، قابلیت اطمینان

مهندسی کیفیت داده‌ها

معماری حاکمیت و اعتماد

تفکر پلتفرمی

  • قالب‌های قابل استفاده مجدد، مسیرهای طلایی

  • الگوهای استاندارد برای مصرف، تبدیل‌ها، آزمایش داده‌های Fivetran

  • ابزارهای سلف سرویس که ذوب نمی‌شوند

ارتباطات (بله، واقعاً)

  • نوشتن اسناد واضح

  • هم‌ترازی تعاریف

  • مودبانه اما قاطعانه «نه» گفتن

  • توضیح بده بستان‌ها بدون اینکه مثل ربات به نظر برسید 🤖

اگر بتوانید این کارها را انجام دهید، سوال «آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد؟» کمتر تهدیدآمیز می‌شود. هوش مصنوعی به اسکلت بیرونی شما تبدیل می‌شود، نه جایگزین شما.


سناریوهای واقع‌بینانه‌ای که در آن‌ها برخی از نقش‌های مهندسی داده کوچک می‌شوند 📉

خب، یه بررسی سریع واقعیت بکنم، چون همه چیز آفتاب و ایموجی‌های رنگی نیست 🎉

برخی از نقش‌ها بیشتر در معرض دید هستند:

  • نقش‌های صرفاً مصرف‌کننده که در آن‌ها همه چیز استاندارد است

  • تیم‌هایی که عمدتاً گزارش‌های تکراری با حداقل جزئیات دامنه انجام می‌دهند

  • سازمان‌هایی که در آنها با مهندسی داده مانند «میمون‌های SQL» رفتار می‌شود (تلخ، اما واقعی)

  • نقش‌های کم‌مسئولیت که در آن‌ها کار فقط تیکت و کپی-پیست است

هوش مصنوعی به همراه ابزارهای مدیریت‌شده می‌تواند این نیازها را کاهش دهد.

اما حتی در آنجا، جایگزینی معمولاً به این شکل است:

  • افراد کمتری کارهای تکراری انجام می‌دهند

  • تأکید بیشتر بر مالکیت پلتفرم و قابلیت اطمینان

  • تغییر به سمت «یک نفر می‌تواند از خطوط لوله بیشتری پشتیبانی کند»

بنابراین بله - الگوهای تعداد کارکنان می‌توانند تغییر کنند. نقش‌ها تکامل می‌یابند. عناوین شغلی تغییر می‌کنند. این بخش واقعی است.

با این حال، نسخه‌ای از این نقش که مالکیت و اعتماد بالایی دارد، همچنان پابرجاست.


خلاصه پایانی 🧾✅

آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد؟ نه به آن شکل کامل و بی‌نقصی که مردم تصور می‌کنند.

هوش مصنوعی:

اما مهندسی داده اساساً در مورد موارد زیر است:

هوش مصنوعی می‌تواند در این زمینه کمک کند... اما «مالک» آن نیست.

اگر مهندس داده هستید، این حرکت ساده است (نه آسان، اما ساده):
به مالکیت، کیفیت، تفکر پلتفرمی و ارتباطات تکیه کنید. بگذارید هوش مصنوعی کارهای کلیشه‌ای را انجام دهد در حالی که شما بخش‌های مهم را مدیریت می‌کنید.

و آره - بعضی وقتا این یعنی بزرگِ جمع باشی. نه پر زرق و برق. هرچند که خیلی قدرتمنده 😄

آیا هوش مصنوعی جایگزین مهندسان داده خواهد شد؟ هوش مصنوعی
جایگزین برخی از وظایف خواهد شد، نردبان شغلی را تغییر خواهد داد و بهترین مهندسان داده را ارزشمندتر خواهد کرد. داستان واقعی همین است.


سوالات متداول

آیا هوش مصنوعی به طور کامل جایگزین مهندسان داده خواهد شد؟

در بیشتر سازمان‌ها، هوش مصنوعی به احتمال زیاد وظایف خاصی را بر عهده می‌گیرد تا اینکه نقش را به طور کامل حذف کند. این فناوری می‌تواند تهیه پیش‌نویس SQL، داربست‌بندی پایپ‌لاین، اولین مجوزهای مستندسازی و ایجاد تست‌های اولیه را تسریع کند. اما مهندسی داده همچنین مالکیت و پاسخگویی را به همراه دارد، به علاوه کار نه چندان جذابِ تبدیل واقعیت آشفته کسب‌وکار به یک سیستم قابل اعتماد. این بخش‌ها هنوز به انسان‌ها نیاز دارند تا تصمیم بگیرند که «درست» چیست و در صورت بروز مشکل، مسئولیت آن را بر عهده بگیرند.

هوش مصنوعی در حال حاضر چه بخش‌هایی از مهندسی داده را خودکار می‌کند؟

هوش مصنوعی در کارهای تکرارپذیر بهترین عملکرد را دارد: تهیه و بازسازی SQL، تولید اسکلت‌های مدل dbt، توضیح خطاهای رایج و تولید طرح‌های کلی مستندات. همچنین می‌تواند تست‌هایی مانند بررسی‌های تهی یا منحصر به فرد بودن را چارچوب‌بندی کند و کد «چسب» الگو را برای ابزارهای تنظیم تولید کند. برد در گرو حرکت است - شما به یک راه‌حل کارآمد نزدیک‌تر می‌شوید - اما هنوز باید صحت آن را تأیید کنید و مطمئن شوید که با محیط شما مطابقت دارد.

اگر هوش مصنوعی بتواند SQL و pipelines را بنویسد، چه چیزی برای مهندسان داده باقی می‌ماند؟

کارهای زیادی انجام می‌شود: تعریف قراردادهای داده، مدیریت رانش طرحواره و اطمینان از اینکه خطوط لوله، خود-توان، قابل مشاهده و قابل بازیابی هستند. مهندسان داده وقت خود را صرف بررسی تغییرات معیارها، ایجاد محافظ برای کاربران پایین‌دستی و مدیریت بده‌بستان‌های هزینه و قابلیت اطمینان می‌کنند. این کار اغلب به ایجاد اعتماد و «آرام» نگه داشتن پلتفرم داده خلاصه می‌شود، به این معنی که به اندازه کافی پایدار باشد که هیچ‌کس مجبور نباشد هر روز به آن فکر کند.

هوش مصنوعی چگونه کار روزمره یک مهندس داده را تغییر می‌دهد؟

این روش معمولاً باعث کاهش حجم مطالب تکراری و «زمان جستجو» می‌شود، بنابراین شما زمان کمتری را صرف تایپ کردن و زمان بیشتری را صرف بررسی، اعتبارسنجی و طراحی می‌کنید. این تغییر، نقش را به سمت تعریف انتظارات، استانداردهای کیفیت و الگوهای قابل استفاده مجدد به جای کدنویسی دستی همه چیز سوق می‌دهد. در عمل، احتمالاً کارهای مشارکتی بیشتری با محصول، امنیت و امور مالی انجام خواهید داد - زیرا ایجاد خروجی فنی آسان‌تر، اما مدیریت آن دشوارتر می‌شود.

چرا هوش مصنوعی با تعاریف مبهم تجاری مانند «کاربر فعال» مشکل دارد؟

از آنجا که منطق کسب‌وکار ایستا یا دقیق نیست - در اواسط پروژه تغییر می‌کند و بسته به ذینفعان متفاوت است. هوش مصنوعی می‌تواند تفسیری را تدوین کند، اما وقتی تعاریف تکامل می‌یابند یا تضادهایی بروز می‌کنند، نمی‌تواند تصمیم را به خود اختصاص دهد. مهندسی داده اغلب نیاز به مذاکره، مستندسازی فرضیات و تبدیل الزامات فازی به قراردادهای پایدار دارد. این کار «هماهنگی انسانی» دلیل اصلی این است که این نقش حتی با بهبود ابزارها از بین نمی‌رود.

آیا هوش مصنوعی می‌تواند مدیریت داده‌ها، حریم خصوصی و انطباق با قوانین را با خیال راحت انجام دهد؟

هوش مصنوعی می‌تواند به تدوین سیاست‌ها یا پیشنهاد رویکردها کمک کند، اما اجرای ایمن همچنان نیازمند مهندسی واقعی و نظارت دقیق است. مدیریت شامل کنترل‌های دسترسی، مدیریت اطلاعات شخصی، قوانین نگهداری، مسیرهای حسابرسی و گاهی اوقات محدودیت‌های اقامت است. اینها حوزه‌های پرخطری هستند که در آنها «تقریباً درست» قابل قبول نیست. انسان‌ها باید قوانین را طراحی کنند، اجرای آنها را تأیید کنند و در قبال نتایج انطباق پاسخگو باشند.

با پیشرفت هوش مصنوعی، چه مهارت‌هایی برای مهندسان داده ارزشمند باقی می‌مانند؟

مهارت‌هایی که سیستم‌ها را انعطاف‌پذیر می‌کنند: تفکر طراحی سیستم، مهندسی کیفیت داده و استانداردسازی مبتنی بر پلتفرم. قراردادها، قابلیت مشاهده، عادات واکنش به حوادث و تحلیل ریشه‌ای منظم، زمانی که افراد بیشتری بتوانند به سرعت مصنوعات داده‌ای تولید کنند، اهمیت بیشتری پیدا می‌کنند. ارتباطات نیز به یک عامل متمایزکننده تبدیل می‌شود - هماهنگ‌سازی تعاریف، نوشتن اسناد واضح و توضیح بده‌بستان‌ها بدون دردسر، بخش بزرگی از قابل اعتماد نگه داشتن داده‌ها است.

کدام نقش‌های مهندسی داده بیشتر در معرض خطر هوش مصنوعی و ابزارهای مدیریت‌شده هستند؟

نقش‌هایی که به‌طور خاص بر روی مصرف تکراری یا گزارش‌های استاندارد متمرکز هستند، بیشتر در معرض خطر قرار دارند، به‌خصوص زمانی که رابط‌های ELT مدیریت‌شده اکثر منابع را پوشش می‌دهند. کارهای کم‌مالکیت و مبتنی بر تیکت می‌توانند کاهش یابند، زیرا هوش مصنوعی و انتزاع، تلاش در هر خط لوله را کاهش می‌دهند. اما این معمولاً به این صورت به نظر می‌رسد که افراد کمتری وظایف تکراری انجام می‌دهند، نه اینکه «هیچ مهندس داده‌ای وجود نداشته باشد». نقش‌های با مالکیت بالا که بر قابلیت اطمینان، کیفیت و اعتماد متمرکز هستند، پایدار می‌مانند.

چگونه باید از ابزارهایی مانند GitHub Copilot یا dbt با هوش مصنوعی بدون ایجاد هرج و مرج استفاده کنم؟

خروجی هوش مصنوعی را به عنوان یک پیش‌نویس در نظر بگیرید، نه یک تصمیم. از آن برای تولید اسکلت‌های پرس‌وجو، بهبود خوانایی یا چارچوب‌بندی تست‌ها و اسناد dbt استفاده کنید، سپس آن را در برابر داده‌های واقعی و موارد خاص اعتبارسنجی کنید. آن را با قراردادهای قوی جفت کنید: قراردادها، استانداردهای نامگذاری، بررسی‌های مشاهده‌پذیری و شیوه‌های بررسی. هدف، تحویل سریع‌تر بدون قربانی کردن قابلیت اطمینان، کنترل هزینه یا مدیریت است.

منابع

  1. کمیسیون اروپا - توضیح حفاظت از داده‌ها: اصول GDPR - commission.europa.eu

  2. دفتر کمیسر اطلاعات (ICO) - محدودیت فضای ذخیره‌سازی - ico.org.uk

  3. کمیسیون اروپا - داده‌ها تا چه مدت می‌توانند نگهداری شوند و آیا به‌روزرسانی آنها ضروری است؟ - commission.europa.eu

  4. موسسه ملی استاندارد و فناوری (NIST) - چارچوب حریم خصوصی - nist.gov

  5. مرکز منابع امنیت رایانه NIST (CSRC) - SP 800-92: راهنمای مدیریت گزارش‌های امنیت رایانه - csrc.nist.gov

  6. مرکز امنیت اینترنت (CIS) - مدیریت گزارش حسابرسی (کنترل‌های CIS) - cisecurity.org

  7. مستندات Snowflake - سیاست‌های دسترسی به سطرها - docs.snowflake.com

  8. مستندات گوگل کلود - امنیت سطح ردیف BigQuery - docs.cloud.google.com

  9. استاندارد قرارداد داده باز BITOL نسخه - bitol-io.github.io

  10. BITOL (GitHub) - استاندارد قرارداد داده باز - github.com

  11. آپاچی ایرفلو - مستندات (پایدار) - airflow.apache.org

  12. آپاچی ایرفلو - DAGها (مفاهیم اصلی) - airflow.apache.org

  13. مستندات آزمایشگاه‌های dbt - dbt چیست؟ - docs.getdbt.com

  14. مستندات آزمایشگاه‌های dbt - درباره مدل‌های dbt - docs.getdbt.com

  15. مستندات آزمایشگاه‌های dbt - مستندات - docs.getdbt.com

  16. مستندات آزمایشگاه‌های dbt - آزمایش‌های داده - docs.getdbt.com

  17. مستندات آزمایشگاه‌های dbt - لایه معنایی dbt - docs.getdbt.com

  18. مستندات Fivetran - شروع به کار - fivetran.com

  19. فایوتران - کانکتورها - fivetran.com

  20. مستندات AWS - راهنمای توسعه‌دهندگان AWS Lambda - docs.aws.amazon.com

  21. گیت‌هاب - گیت‌هاب کوپایلوت - github.com

  22. اسناد گیت‌هاب - دریافت پیشنهاد کد در IDE با GitHub Copilot - docs.github.com

  23. آموزش مایکروسافت - گیت‌هاب کمک خلبان برای SQL (افزونه VS Code) - learn.microsoft.com

  24. مستندات Dynatrace - مشاهده‌پذیری داده‌ها - docs.dynatrace.com

  25. دیتاگلکسی - مشاهده‌پذیری داده‌ها چیست؟ - datagalaxy.com

  26. مستندات انتظارات بزرگ - مروری بر انتظارات - docs.greatexpectations.io

جدیدترین هوش مصنوعی را در فروشگاه رسمی دستیار هوش مصنوعی پیدا کنید

درباره ما

بازگشت به وبلاگ