در عصر دیجیتال که تصاویر بخش عمدهای از تعاملات آنلاین ما را تشکیل میدهند، جستجوی تصویر با AI Mode گوگل به عنوان یک نوآوری کلیدی ظاهر شده است. تصور کنید بتوانید با آپلود یک عکس ساده از یک لباس یا یک منظره، نه تنها اطلاعات دقیق در مورد آن دریافت کنید، بلکه پیشنهادهای شخصیسازیشده، لینکهای خرید و حتی تحلیلهای عمیق بصری را در کسری از ثانیه ببینید. این قابلیت، بخشی از AI Mode در Google Search، با ادغام مدلهای پیشرفته Gemini 2.5 و ابزارهای بصری مانند Google Lens، مرزهای جستجو را جابهجا کرده است. از زمان معرفی اولیه در آوریل ۲۰۲۵ (فروردین ۱۴۰۴) تا بهروزرسانیهای اخیر در سپتامبر همان سال، AI Mode نه تنها جستجوی تصویری را conversational کرده، بلکه صنایع مانند خردهفروشی، طراحی و آموزش را دگرگون ساخته است.
این مقاله جامع، بر اساس بررسیهای بهروز از منابع معتبر مانند وبلاگ رسمی Google، گزارشهای CNBC، The Verge و Search Engine Land، به کاوش عمیق در جستجوی تصویر با AI Mode میپردازد. ما از تاریخچه و فناوری پشت صحنه تا کاربردهای عملی در خرید آنلاین، چالشهای اخلاقی مانند bias و privacy، و چشمانداز آینده خواهیم پرداخت. اگر به دنبال درک کاملی از اینکه چگونه AI Mode گوگل در جستجوی تصویر میتواند آینده کشف بصری را تغییر دهد هستید، این راهنما برای شماست.
مقدمه: چرا جستجوی تصویر با AI Mode در سال ۱۴۰۴ اهمیت دارد؟
در سال ۱۴۰۴، جستجوی بصری از یک ابزار ساده به یک تجربه هوشمند تبدیل شده است. AI Mode، که در مه ۲۰۲۵ (اردیبهشت ۱۴۰۴) به عنوان بخشی از Google Search Labs راهاندازی شد، با تمرکز بر multimodal search، کاربران را قادر میسازد تا با تصاویر، متن و صدا تعامل کنند. طبق گزارش Google در سپتامبر ۲۰۲۵، این ویژگی با “visual search fan-out”، تحلیل عمیق تصاویر را ممکن میسازد و بیش از ۱۰ درصد افزایش در استفاده از جستجوهای پیچیده ایجاد کرده است. اهمیت آن فراتر از فناوری است؛ این ابزار میتواند خردهفروشان را از وابستگی به کلمات کلیدی رها کند و به کاربران کمک کند تا “vibe” مورد نظرشان را پیدا کنند، مانند جستجوی “بالشهای آبی با طرحهای جسورانه”.
اما این نوآوریها بدون چالش نیستند: نگرانیهای bias در نتایج تصویری، مسائل حریم خصوصی در آپلود تصاویر و تأثیر بر مشاغل سنتی، بحثهای داغی را برانگیخته. در این مقاله، با تمرکز بر جستجوی تصویر AI Mode گوگل و چالشهای اخلاقی آن، به بررسی این جنبهها میپردازیم. هدف ما ارائه دیدگاهی متعادل است تا خوانندگان بتوانند پتانسیلها و ریسکها را ارزیابی کنند.
تاریخچه توسعه جستجوی تصویر با AI Mode: از Lens تا multimodal
ریشههای AI Mode در اکوسیستم Google
جستجوی تصویر گوگل از سال ۲۰۰۱ با Google Images آغاز شد، اما ادغام AI واقعی با Google Lens در ۲۰۱۷ (۱۳۹۶) نقطه عطفی بود. Lens، با قابلیت تشخیص اشیاء از طریق دوربین، پایهای برای multimodal search شد. در ۲۰۲۳، با معرفی Gemini – مدل multimodal گوگل – زمینه برای AI Mode فراهم گردید. AI Mode در مارس ۲۰۲۵ (اسفند ۱۴۰۳) به عنوان آزمایش Search Labs راهاندازی شد و در آوریل، قابلیت آپلود تصویر اضافه شد.
طبق وبلاگ Google، AI Mode از دادههای عظیم Lens Index (میلیاردها تصویر) برای آموزش استفاده میکند، اما جزئیات دقیق را فاش نکرده، که منبع نگرانیهای اخلاقی است. در مه ۲۰۲۵، نسخه اولیه برای کاربران Google One AI Premium در آمریکا منتشر شد، با محدودیتهایی مانند تحلیل تصاویر تا ۱۰۲۴px.
بهروزرسانیهای کلیدی در سال ۱۴۰۴
سال ۱۴۰۴ تحولآمیز بود. در آوریل، multimodal capabilities اضافه شد، اجازه آپلود عکس و سؤال در مورد آن را داد. در سپتامبر، “visual search fan-out” معرفی شد، که تصاویر را تجزیه کرده و چندین query همزمان اجرا میکند. این بهروزرسانی، جستجو را conversational کرد، مانند “این لباس را در رنگ تیرهتر نشان بده”.
در اکتبر ۲۰۲۵، Google شورای اخلاقی AI را تشکیل داد تا بر bias در نتایج تصویری نظارت کند، پاسخی به انتقادات FTC. همچنین، به سمت opt-in برای دادههای آموزشی حرکت کرد، جایی که کاربران کنترل بیشتری بر تصاویر آپلودشده دارند.
فناوری پشت AI Mode در جستجوی تصویر: چگونه کار میکند؟

میتوانید با دستورات صوتی در AI Mode گوگل بهدنبال یک کالا بگردید
گوگل درباره این قابلیت جدید میگوید: «از امروز میتوانید یک سؤال را بهصورت محاورهای بپرسید و در AI Mode مجموعهای از نتایج تصویری دریافت کنید. سپس دقت جستجوی خود را به شکلی که برایتان طبیعیتر است افزایش دهید، و بعد تصاویر غنیتری خواهید دید که با حالوهوایی که به دنبالش هستید مطابقت دارند و میتوانید به هر روشی که برایتان طبیعیتر است به جستجو ادامه دهید، مثلاً درخواست نمایش گزینههای بیشتری با حالتهای رنگی تیره و طرحهای برجسته داشته باشید.»
برای مثال، کاربران AI Mode حالا میتوانند به دنبال کالایی مثل «شلوار جین که خیلی گشاد نباشد» بگردند و سپس نتایج را با درخواستهای اضافی مانند «میخواهم قد آن تا مچ پا باشد» یا «جین اسیدشوییشده نشانم بده» دقیقتر کنند. به گفته گوگل، AI Mode بهطور هوشمند مجموعهای مرتبط از گزینههای قابلخرید را به کاربران ارائه میدهد و به آنها اجازه خواهد داد تا بهراحتی برای خرید موارد موجود در نتایج جستجو به سایت خردهفروشان مراجعه کنند.
همچنین کاربران میتوانند جستجوی خود را با آپلود یک تصویر مرجع یا گرفتن عکس برای یافتن نتایج بصری مشابه آغاز کنند یا ترکیبی از تصاویر و توضیحات را برای دقیقترکردن جستجو به AI Mode بدهند. قابلیت جستجوی محاورهای برای جستجوهای تصویری عمومی نیز کار میکند، مثلاً میتوانید تصاویری برای الهام گرفتن در طراحی داخلی یک اتاق دریافت کنید.
قابلیتهای جدید جستجوی تصویری AI Mode این هفته به زبان انگلیسی برای کاربران آمریکایی عرضه خواهد شد. گوگل میگوید این قابلیت جدید براساس Google Search با Lens و Image Search و قابلیتهای پیشرفته چندرسانهای و زبانی جمینای ۲.۵ ساخته شده اس
معماری مدل: Gemini 2.5 و Visual Fan-Out
AI Mode بر پایه Gemini 2.5 عمل میکند، که multimodal است و متن، تصویر و صدا را پردازش میکند. فرآیند “visual search fan-out” تصاویر را به اجزای کوچک تجزیه میکند: Lens اشیاء اصلی و ثانویه را شناسایی کرده، Gemini روابط (مانند رنگ، مواد، شکل) را درک میکند. سپس، چندین query همزمان اجرا میشود – مثلاً برای “عکس یک گلدان”، queryهایی در مورد نوع گیاه، مواد و سبک دکور.
در بهروزرسانی سپتامبر، پیشرفتها شامل:
- تحلیل contextual: درک روابط اشیاء، مانند “این گلدان چطور با مبل هماهنگ میشود”.
 - کنترلپذیری بالا: follow-up questions مانند “نسخههای ارزانتر نشان بده”.
 - پشتیبانی ورودی متنوع: آپلود عکس، ویدیو یا اسکچ.
 
مدل از transformerها برای پیشبینی روابط بصری استفاده میکند، با تمرکز بر object recognition و scene understanding. رزولوشن تا ۱۰۸۰p و سرعت ثانیهای، آن را برای موبایل ایدئال میکند.
مقایسه فنی با ویژگیهای قبلی
در بنچمارکهای Google، AI Mode در دقت بصری ۳۰ درصد بهتر از Lens سنتی عمل میکند. بر خلاف Circle to Search (تمرکز بر شناسایی سریع)، AI Mode در reasoning عمیق برتر است. با این حال، گاهی hallucination دارد، مانند شناسایی نادرست اشیاء.
قابلیتهای AI Mode در جستجوی تصویر: از آپلود تا شخصیسازی
جستجو با تصویر و متن
AI Mode کاربران را قادر میسازد تصاویر آپلود کنند و سؤال بپرسند: مثلاً عکس یک کتابخانه آپلود کنید و “کتابهای مشابه پیشنهاد بده” بگویید. Gemini صحنه را تحلیل کرده، روابط را درک میکند و نتایج با لینک ارائه میدهد.
ابزارهای conversational و shopping
فید نتایج شامل grid تصاویر است، با follow-up مانند “با tones تیرهتر”. ادغام Shopping Graph، محصولات را با قیمت و نظرات نشان میدهد. در موبایل، zoom on image برای سؤالهای خاص امکانپذیر است.
محدودیتها و بهبودها
AI Mode تصاویر تا ۲۰ مگابایت را پردازش میکند و گاهی در جزئیات پیچیده ضعیف است. Google با watermark SynthID و C2PA metadata ایمنی را افزایش داده.
کاربردهای جستجوی تصویر AI Mode در خردهفروشی و طراحی
تحول در خرید آنلاین
AI Mode خردهفروشی را دگرگون میکند. طبق CNBC، کاربران با آپلود عکس لباس، گزینههای مشابه را با vibe مورد نظر پیدا میکنند، که ۵۰ درصد نرخ تبدیل را افزایش میدهد. طراحان از آن برای inspiration استفاده میکنند، مانند “دکور maximalist با tones تیره”.
در ایران، کاربران با آپلود عکس محصولات محلی، پیشنهادهای جهانی دریافت میکنند – مثلاً صحنههای اکشن بدون نیاز به جستجوی دستی. در طراحی، ابزار برای storyboard ایدئال است، اما انجمنهای طراحان نگران از دست رفتن مشاغل هستند.
کاربردها در آموزش و محتوای اجتماعی
در آموزش، AI Mode تصاویر آموزشی را تحلیل میکند – مثلاً آپلود عکس گیاه و سؤال در مورد مراقبت. Meta’s tools رقبا هستند، اما AI Mode با remix بصری، engagement را افزایش میدهد. طبق LBBOnline، طراحان از آن برای ideation سریع استفاده میکنند.
مثالهای واقعی از کاربردها
- خرید: آپلود عکس مبل، پیشنهادهای هماهنگ با قیمت.
 - طراحی: جستجوی “vibe bedroom maximalist” با تصاویر الهامبخش.
 - آموزش: تحلیل عکس تاریخی برای توضیحات عمیق.
 
مقایسه AI Mode با رقبا: برتریها و نقاط ضعف
رقبای اصلی
- Bing Visual Search: برتر در synced-results، اما کمتر conversational.
 - Perplexity AI: تمرکز بر vibe، اما realism کمتر از AI Mode.
 - ChatGPT Vision: ویرایش پیشرفته، اما بدون Shopping Graph.
 
AI Mode در controllability و realism پیشتاز است، اما در سرعت محدودتر.
| ابزار | Realism | سرعت | conversational | Shopping | قیمت | 
|---|---|---|---|---|---|
| AI Mode | عالی | خوب | عالی | بله | رایگان/Pro | 
| Bing Vision | عالی | عالی | متوسط | خیر | رایگان | 
| Perplexity | خوب | متوسط | عالی | خیر | ۲۰$ | 
آینده AI Mode: چشمانداز و توصیهها
AI Mode آینده جستجو را شکل میدهد: ویدیوهای طولانیتر، ادغام VR و شخصیسازی بیشتر. Google برنامههایی برای API و Pro mode دارد. اما نیاز به مقررات قویتر است.
توصیهها: خردهفروشان از AI Mode برای محصولات استفاده کنند؛ کاربران consent را اولویت دهند.
نتیجهگیری: AI Mode، پلی به آینده کشف بصری
AI Mode نه تنها فناوری، بلکه تحولی اجتماعی است. با پتانسیل دموکراتیک کردن جستجو، اما با ریسکهای اخلاقی، نیاز به تعادل دارد. Google با بهروزرسانیها گامهای مثبتی برداشته، اما جامعه باید نقش ایفا کند. آینده AI Mode روشن است – اگر مسئولانه هدایت شود.
منابع اضافی: برای اطلاعات بیشتر، Google AI Mode را ببینید. نظرات خود را در کامنتها بنویسید! 🚀