روابط عمومی شرکت ایدکو (توزیعکنندهی محصولات کسپرسکی در ایران)؛ مقالهای در Science Magazine که اواسط ژانویه منتشر شد روش غیرمعمولِ جاسوسی کاربران اسمارتفونی را شرح میدهد که از طریق حسگر نورِ محیط[1] انجام میشود. در ادامه با ما همراه شوید تا از ساز و کار این جاسوسی سر دربیاوریم.
همه اسمارتفونها و تبلتها این اجزا را به طور درونسازهای دارند (درست مانند بسیاری از لپتاپها و تلویزیونها). تسک اولیه این اجزا این است که میزان نور محیط را در فضایی که دستگاه قرار دارد درک کند و روشنایی نمایشگر را بر اساس آن تنظیم کند. اما ابتدا باید توضیح دهیم چرا عامل تهدید باید به جای دوربین معمولی دستگاه هدف، از چنین روش عجیبی استفاده کند. دلیل این است که حسگرهایی که ما «نامناسب یا نامعمول» میخوانیم معمولاً تماماً محافظتنشده هستند. بیایید تصور کنیم مهاجمی کاربری را فریب داده که روی اسمارتفونش برنامه مخرب نصب کند. این بدافزار برای دسترسی پیدا کردن به اجزای مورد هدف مانند میکروفون یا دوربین دست و پا خواهد زد اما همین سناریو برای حسگر نور محیط مثل آب خوردن است. پس محققین ثابت کردند این حسگر نور محیط میتواند به جای دوربین استفاده شود (برای مثال برای گرفتن اسنپشات دست کاربر که دارد پین را روی کیبورد مجازی وارد میکند). به لحاظ تئوری با تحلیل چنین دادههایی ممکن است بشود خود پسورد را نیز از نو ساخت.
حسگر نور یک فناوری نسبتاً بدوی است. یک فتوسل حساس به نور برای اندازهگیری میزان روشنایی نور محیط آن هم چندین بار در ثانیه. دوربینهای دیجیتال از حسگرهای نور مشابهی (البته کوچکتر) استفاده میکنند اما میلیونها نسخه از آنها وجود دارد. لنز تصویری را روی این ماتریس فتوسل میاندازد، روشنایی هر المان اندازهگیری میشود و نتیجه میشود یک عکاسی دیجیتال. بنابراین میتوانید حسگر نور را بدویترین دوربنی دیجیتالی بخوانید: رزولوشن آن دقیقاً یک پیکسل است. چطور چنین چیزی میتواند اتفاقات روی دستگاه را ثبت کند؟ محققین از اصل متقابل Helmholtz که اواسط قرن 19 مطرح شد استفاده کردند. این اصل به طور گسترده در گرافیکهای کامپیوتر استفاده میشود؛ برای مثال جایی که محاسبات به طرز شگفتانگیزی سادهسازی میشود. در سال 2005 این اصل پایهی متود پیشنهادیِ عکاسی دوگانه را شکل داد. بیایید برای فهم بیشتر به تصویری که در این مقاله منتشر شد نگاه کنیم:
تصور کنید دارید از اجسامی روی میز عکاسی میکنید. یک لامپ روی اجسام میتابد، نور منعکسشده به لنز دوربین برخورد میکند و نتیجه میشود عکاسی کاملاً معمولی. . در عکس بالا تصویر سمت چپ دقیقاً چنین عکسی است. سپس به معنای سادهاش، محققین شروع کردند تغییر نور لامپ و ضبط تغییرات در روشنایی. در نتیجه آنها اطلاعات کافی برای بازسازی تصویر سمت راست را جمع کردن (طوری گرفته شده انگار از نقطه دید لامپ است). در این موقعیت دوربینی وجود ندارد و هرگز هم وجود نداشته اما بنا بر سنجشها، صحنه به طور موفقیتآمیزی بازسازی شده بود. از همه جالبتر این است که این ترفند حتی به دوربین هم نیاز ندارد. یک عکاس ساده هم انجامش خواهد داد- درست مانند همانی که در حسگر نور محیط است. مقاومت نوری (یا «دوربین تک پیکسلی») تغییرات نور منعکس شده از اجسام را اندازه گیری کرده و از این دادهها برای ساختن عکسی از آنها استفاده میشود.
کیفیت تصویر پایین خواهد بود و اندازه گیری های زیادی باید انجام شود - تعداد آنها به صدها یا هزاران میرسد.
بیایید به مطالعه و حسگر نور برگردیم. نویسندگان مقاله از تبلت نسبتاً بزرگ Samsung Galaxy View با صفحه نمایش 17 اینچی استفاده کردند. الگوهای مختلفی از مستطیل های سیاه و سفید بر روی صفحه نمایش تبلت نمایش داده شد. یک مانکن رو به روی صفحه نمایش در نقش کاربری قرار داشت که چیزی را روی صفحه کلید روی صفحه وارد میکرد. سنسور نور تغییرات روشنایی را ثبت کرد. در چندین صد اندازه گیری مانند این، تصویری از دست مانکن تولید شد. یعنی نویسندگان از اصل متقابل هلمهولتز برای گرفتن عکسی از دست استفاده کردند که انگار از دید صفحه نمایش گرفته شده بود. محققین به طور موثر صفحه نمایش تبلت را به دوربینی بسیار کم کیفیت تبدیل کردند.
درست است، واضح ترین تصویر نیست. تصویر بالا سمت چپ نشان میدهد چه چیزی باید گرفته شود: در یک مورد، کف دست باز مانکن. در مورد دیگر، چگونه به نظر میرسد "کاربر" روی چیزی روی صفحه نمایش ضربه میزند. تصاویر در مرکز یک "عکس" بازسازی شده با وضوح 32×32 پیکسل هستند که تقریباً هیچ چیز در آن قابل مشاهده نیست - نویز بیش از حد در داده ها. اما با کمک الگوریتمهای یادگیری ماشینی، نویز برای تولید تصاویر سمت راست فیلتر شد، جایی که میتوانیم موقعیت یک دست را از دیگری تشخیص دهیم. نویسندگان مقاله نمونههای دیگری از ژستهای معمولی را که افراد هنگام استفاده از صفحه نمایش لمسی تبلت انجام میدهند، ارائه میدهند. یا بهتر بگوییم، نمونههایی از اینکه چگونه آنها موفق به "عکاسی" از آنها شدند:
پس میتوانیم این متود را در عمل به کار گیریم؟ ممکن است بشود نظارت کرد کاربر چطور با تاچ اسکرین تبلت یا اسمارتفون تعامل میکند؟ چطور متنی را روی کیبورد آناسکرین وارد میکند؟ میشود نظارت کرد چطور کاربر جزئیات بانکیاش را وارد میکند؟ چطور اپها را باز میکند؟ خوشبختانه هنوز این روش آنقدرها هم ساده نشده. به کپشنهای بالای عکاسیها در تصویر فوق دقت کنید. آنها نشان میدهند ساز و کار این متود بسیار کند است. در بهترین حالت ممکن محققین توانستند عکس دست را در کمتر از سه دقیقه بازسازی کنند. تصویر عکس قبلی هم 17 دقیقه طول کشید تا گرفته شود. نظارت در لحظه با چنین سرعتی قابل بحث نیست.
همچنین اکنون واضح است که چرا در بیشتر آزمایشها دست مانکن است: دست انسان نمیتواند برای مدت زیادی بیحرکت بماند. اما این امکان پیشرفت این متود را از بین میبرد؟ باید بدترین سناریو را هم مرور کنیم: اگر هر تصویر دست را بشود نه در سه دقیقه که فرضاً در نیم ثانیه بدست آورد، اگر خروجی روی صفحه نه یک سری اشکال سیاه سفید عجیب و غریب که ویدیویی از مجموعه عکسها یا انیمیشن مورد علاقه کاربر باشد و اگر کاربر کاری که ارزش جاسوسی را داشته باشد انجام دهد آنوقت حمله منطقی خواهد بود و با عقل جور درخواهد آمد. اما همان موقع هم شاید آنقدر منطقی نباشد: کل نیروی محققین با این حقیقت که «اگر مهاجم تصمیم بگیرد بدافزاری را روی دستگاه قربانی بگذارد کلی راههای سادهتر برای فریب کاربر جهت ورود پسورد یا جزئیات کارت اعتباری وجود دارد» تضعیف میشود. شاید ما برای اولین بار در بخش پوششدهی چنین مقالاتی است که در تقلاییم حتی سناریویی در زندگی واقعی برای این حمله متصور شویم. تنها کاری که میتوانیم بکنیم شگفتزده شدن از زیبایی این متود پیشنهادی است. این پژوهش حکم یادآور دارد: باید یادمان باشد حتی دستگاههای به ظاهر آشنا و معصوم که ما را از هر طرف محاصره کردهاند میتوانند کارکردهای نامعمول و کمتر شناختهشده داشته باشند. با این حال برای کسانی که نگران نقض احتمالی حریم خصوصیاند، راهکار ساده است: چنین تصاویر کم کیفیتی نتیجهی این حقیقت هستند که حسگر نور به ندرت اندازهگیری را انجام میدهد: هر ثانیه بین 10 تا 20 بار. دادههای خروجی هم از دقت بالایی برخوردار نیستند. اما این فقط به تبدیل کردن حسگر به دوربین مرتبط است. برای تسک اصلی که همان اندازهگیری نور محیط باشد، این نرخ بسیار زیاد است. میتوانیم دادهها را حتی بیشتر «درشت کنیم»؛ مثلاً انتقال آنها 5 برابر بیشتر از 20 بار بر ثانیه. برای مطابقت روشنایی صفحه با نور حیط این حتی از کافی هم کافیتر است. اما جاسوسی از طریق حسگر –که همین الانش غیرممکن است- اجرایی و انجامپذیر نخواهد بود.
[1] ambient light sensor
منبع: کسپرسکی آنلاین (ایدکو)
کسپرسکی اسم یکی از بزرگترین شرکتهای امنیتی و سازنده آنتی ویروس است که برخی از کاربران اشتباهاً این شرکت و محصولات آنتی ویروس آن را با عناوینی نظیر کسپرسکای،کاسپرسکی، کسپراسکای، کسپراسکای، و یا کاسپراسکای نیز میشناسد. همچنین لازم به ذکر است مدیرعامل این شرکت نیز یوجین کسپرسکی نام دارد.