Mohammad Khodashahi

Software developer and Data scientist.

اولین تجربه کار با دیتا

حدود ۱۲ سال پیش به مناسبتی با پلیس تو پیدا کردن دزد بانک همکاری کردم. شبانه دستگاه ATM یه بانک تو شهرستان رو باز کرده بودن و یه مقدار پول دزدیده شده بود.

اون زمان اصلا نمیدونستم دیتا ساینس چی هست و چه کاربردی داره.

کاراگاه پرونده که آدم باهوشی بود چون هیچ نشونه ای از دزدها به جا نمونده بود. تنها راه پیدا کردن دزدها رو در بررسی تلفنهایی که زده شده بود میدونست و با درخواست قضایی تونست کل مکالمات ۲۴ ساعت از زمانی که حدس میزد دزدی اتفاق افتاده رو بگیره. و من از اینجا وارد همکاری با این گروه شدم.
حدود ۵ میلیون رکورد دیتا وجود داشت از پرووایدرهای مختلف که به صورت فایل text بود و هیچ اطلاعاتی در مورد اینکه هر فیلد دیتا چی هست آیا یکتا هست یا نه و … نداشتیم.
کاراگاه دنبال پیدا کردن یه پترن در تماسهای تکراری در یک بازه ۲ تا ۳ ساعته بین ۲ تا ۳ تا تلفن بود چون فکر میکرد دزدها باید با هم تماس میداشتن و یک یا ۲ نفر نگهبان بودن و یک نفر در حال باز کردن دستگاه بوده.

بعد حدود ۲ ماه مرتب کردن داده یا همون pre processing و بعد کد زدن برای پیدا کردن پترن ها.  یک سری شماره  همراه رو پیدا کردیم که در اون شب تماسهای مکرر داشتن.
اما بعضی از شماره ها صاحبی نداشتن و نمیشد دزدها رو پیدا کرد و بعضی دیگر تماسهای معمولی ۳ یا ۴ باره بین افراد بود تا اینکه یه پترن جالب پیدا شد که دزدها بین یه بازه ۳ ساعته بیشتر از ۱۰ بار تماس داشتن  اما شماره تماسها صاحب نداشتن و نمیشد کاری کرد.
مجبور شدیم حالا بریم سراغ بقیه فیلدهای دیتا که داشتیم و ببینیم چه اطلاعاتی به ما میدن feature selection یه فیلد مربوط به  IMEI  گوشی بود که عدد یکتا گوشی هست. شروع به بررسی این فیلد دیتا کردیم ببینیم چه اطلاعاتی میتونیم بدست بیاریم .
گوشی یکی از شماره هایی که ناشناس بود سیم کارت رو عوض کرده بود و یه پیامک به شماره دیگه با گوشی شماره مورد نظر داده بود و صاحب شماره مشخص بود و در جریان یه عملیات دیتا ساینسی دزدها بعد حدود ۳ ماه پیدا و دستگیر شده و تجربه بسیار خوبی شد واسه من.

Leave a Reply

Your email address will not be published. Required fields are marked *.

*
*
You may use these <abbr title="HyperText Markup Language">HTML</abbr> tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Before you go...

Get a fresh article in your inbox.