ഗൂഗിൾ ജെമിനി ഓമ്നി (Gemini Omni): ഇനി വീഡിയോ എഡിറ്റിംഗ് വെറും സംസാരം പോലെ!
May 23
/
Anjana A
നമസ്കാരം സുഹൃത്തുക്കളെ! മനോഹരമായ ഒരു വീഡിയോ എഡിറ്റ് ചെയ്ത് സോഷ്യൽ മീഡിയയിൽ പങ്കുവെക്കാൻ ആഗ്രഹിക്കാത്തവരായി ഇന്ന് ആരുമില്ല. എന്നാൽ വീഡിയോ എഡിറ്റിംഗ് എന്ന് കേൾക്കുമ്പോൾ തന്നെ പലർക്കും തലവേദനയാണ്. ലെയറുകൾ, ടൈംലൈൻ, കളർ ഗ്രേഡിംഗ് അങ്ങനെ സങ്കീർണ്ണമായ എത്രയോ കാര്യങ്ങൾ! നമ്മൾ ആഗ്രഹിക്കുന്ന ഒരു ചെറിയ മാറ്റം വീഡിയോയിൽ വരുത്താൻ പോലും മണിക്കൂറുകൾ കഷ്ടപ്പെടേണ്ടി വരാറുണ്ട്, അല്ലേ?എന്നാൽ ഇനി ആ കഷ്ടപ്പാടുകൾക്ക് അറുതിയാവുകയാണ്. Google I/O 2026 സമ്മേളനത്തിൽ അവതരിപ്പിച്ച ജെമിനി ഓമ്നി (Gemini Omni) എന്ന മാന്ത്രിക വിദ്യയെക്കുറിച്ചാണ് ഇന്നത്തെ നമ്മുടെ ബ്ലോഗ്. നിങ്ങളുടെ ഫോണിനുള്ളിൽ ഇരിക്കുന്ന ഒരു സിനിമ ഡയറക്ടറെപ്പോലെ പ്രവർത്തിക്കാൻ ഇതിന് സാധിക്കും.
ജെമിനി 3.5 ഫ്ലാഷ് (Gemini 3.5 Flash): വേഗതയുടെ പുത്തൻ യുഗം
ജെമിനി ഓമ്നിയെക്കുറിച്ച് പറയുന്നതിന് മുൻപ് മറ്റൊരു വലിയ വാർത്തയുണ്ട്. ഗൂഗിളിൻ്റെ ഏറ്റവും പുതിയ എഐ (AI) മോഡലായ ജെമിനി 3.5 ഫ്ലാഷ് (Gemini 3.5 Flash) ഇപ്പോൾ ലഭ്യമാണ്. ഇതിൻ്റെ ഏറ്റവും വലിയ പ്രത്യേകത അതിൻ്റെ അതിശയിപ്പിക്കുന്ന വേഗതയാണ്.Fast Facts:
- മറ്റ് മുൻനിര എഐ മോഡലുകളെ അപേക്ഷിച്ച് 4 മടങ്ങ് വേഗത ഇതിനുണ്ട്
- TPS (Tokens Per Second): എഐ എത്ര വേഗത്തിൽ ചിന്തിച്ച് നമുക്ക് മറുപടി നൽകുന്നു എന്നതാണ് ഇതിലൂടെ അളക്കുന്നത്. മറ്റ് മോഡലുകളെ അപേക്ഷിച്ച് ഇതിൻ്റെ പ്രതികരണ വേഗത വളരെ കൂടുതലാണ്.
- ഇപ്പോൾ ജെമിനി ആപ്പിലും ഗൂഗിൾ സെർച്ചിൻ്റെ എഐ മോഡിലും (AI Mode) ഡിഫോൾട്ട് മോഡലായി പ്രവർത്തിക്കുന്നത് ഇതാണ്.
- കൂടുതൽ സങ്കീർണ്ണമായ ജോലികൾക്കായി ജെമിനി 3.5 പ്രോ (Gemini 3.5 Pro) അടുത്ത മാസം (ജൂൺ 2026) പുറത്തിറങ്ങും.
എന്താണ് ജെമിനി ഓമ്നി (Gemini Omni)?
ഗൂഗിൾ ഡീപ് മൈൻഡ് വികസിപ്പിച്ചെടുത്ത ഒരു Any-to-Any മോഡലാണ് ജെമിനി ഓമ്നി. സാധാരണ എഐ ടൂളുകൾ വെറും ടെക്സ്റ്റ് മാത്രം മനസ്സിലാക്കുമ്പോൾ, ജെമിനി ഓമ്നിക്ക് ടെക്സ്റ്റ്, ചിത്രം, ഓഡിയോ, വീഡിയോ എന്നിവ ഒരേസമയം വിശകലനം ചെയ്യാനും തിരിച്ച് മികച്ച വീഡിയോ ഔട്ട്പുട്ട് നൽകാനും സാധിക്കും.ജെമിനി ഓമ്നി യഥാർത്ഥത്തിൽ ഒരു 'റീസണിംഗ്' (Reasoning) മോഡലാണ്. അതായത്, വീഡിയോ നിർമ്മാണത്തിനായി ഗൂഗിളിൻ്റെ വീയോ (Veo) എന്ന റെൻഡറിംഗ് എൻജിനെ ഇത് ഉപയോഗിക്കുന്നുണ്ടെങ്കിലും, എന്ത് ചെയ്യണം എങ്ങനെ ചെയ്യണം എന്ന് ബുദ്ധിപരമായി തീരുമാനിക്കുന്നത് ജെമിനി ഓമ്നിയാണ്.ഇതിലേക്ക് നൽകാൻ കഴിയുന്ന ഇൻപുട്ടുകൾ:
- ടെക്സ്റ്റ് (ലിഖിത നിർദ്ദേശങ്ങൾ)
- ചിത്രം (ഫോട്ടോകൾ)
- ഓഡിയോ (ശബ്ദം)
- വീഡിയോ
സംസാരത്തിലൂടെ വീഡിയോ എഡിറ്റ് ചെയ്യാം (Conversational Editing)
ജെമിനി ഓമ്നിയുടെ ഏറ്റവും വലിയ വിപ്ലവം അതിൻ്റെ 'കോൺവർസേഷണൽ എഡിറ്റിംഗ്' ആണ്. പണ്ട് ഫോട്ടോഷോപ്പിലും മറ്റും ലെയറുകൾ മാറ്റി കളിച്ചിരുന്നെങ്കിൽ, ഇനി ജെമിനിയോട് സംസാരിച്ചുകൊണ്ട് വീഡിയോയിൽ മാറ്റങ്ങൾ വരുത്താം. ഓരോ തവണ മാറ്റം വരുത്തുമ്പോഴും വീഡിയോ ആദ്യം മുതൽ നിർമ്മിക്കേണ്ടതില്ല, പകരം മുൻപ് നൽകിയ നിർദ്ദേശങ്ങൾ ഓർത്തുവെച്ച് ബാക്കി മാറ്റങ്ങൾ വരുത്താൻ ഇതിന് കഴിയും.ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്ന് താഴെ പറയുന്ന ഉദാഹരണത്തിലൂടെ നോക്കാം:
- മാറ്റത്തിന് മുൻപ് (Before): ഒരു വയലിനിസ്റ്റ് വയലിൻ വായിക്കുന്ന സാധാരണ വീഡിയോ.
- മാറ്റത്തിന് ശേഷം (After): ജെമിനിയോട് നിർദ്ദേശിച്ചതനുസരിച്ച് വയലിൻ അദൃശ്യമാകുന്നു (Invisible), പശ്ചാത്തലം (Background) ഒരു ആഡംബര പെന്റ് ഹൗസായി മാറുന്നു, ക്യാമറ ആംഗിൾ വയലിനിസ്റ്റിൻ്റെ തോളിലൂടെയുള്ള കാഴ്ചയിലേക്ക് (Over-the-shoulder view) മാറുന്നു.നിങ്ങളുടെ വീഡിയോയിലെ ബട്ടർഫ്ലൈയെ തേനീച്ചയാക്കാനോ അല്ലെങ്കിൽ ഒരു പ്രതിമ കുമിളകൾ (Bubbles) കൊണ്ട് നിർമ്മിച്ചതാണെന്ന് തോന്നിപ്പിക്കാനോ വെറും ഒരു വരി നിർദ്ദേശത്തിലൂടെ സാധിക്കും.
ലോകവിജ്ഞാനവും ഫിസിക്സും (World Knowledge & Physics)
പഴയ എഐ വീഡിയോകളിൽ വസ്തുക്കൾ വായുവിൽ ഒഴുകി നടക്കുന്നത് പോലെ തോന്നാറുണ്ടായിരുന്നു. എന്നാൽ ജെമിനി ഓമ്നിക്ക് ഭൂഗുരുത്വ നിയമങ്ങൾ (Gravity), ദ്രാവകങ്ങളുടെ ചലനം (Fluid dynamics) എന്നിവയെക്കുറിച്ച് കൃത്യമായ ധാരണയുണ്ട്.ഉദാഹരണത്തിന്, ഒരു കുട്ടയിൽ നിന്നും ഗോട്ടികൾ (Marbles) താഴെ വീഴുന്ന വീഡിയോ നിർമ്മിച്ചാൽ, അവ തറയിൽ തട്ടി ചിതറി തെറിക്കുന്നത് ഒരു ലോട്ടറി മെഷീനിലെ ഗോളങ്ങൾ കറങ്ങുന്നത് പോലെ തികച്ചും സ്വാഭാവികമായിരിക്കും. അതുപോലെ തന്നെ ശാസ്ത്രീയ കാര്യങ്ങൾ ലളിതമായി പഠിപ്പിക്കാനും ജെമിനി മിടുക്കനാണ്. സങ്കീർണ്ണമായ പ്രോട്ടീൻ ഫോൾഡിംഗ് (Protein folding) പോലുള്ള വിഷയങ്ങൾ പോലും ക്ലേമേഷൻ (Claymation) രീതിയിൽ കൃത്യമായ വിവരങ്ങളോടെ വീഡിയോ ആക്കി മാറ്റാൻ ജെമിനിക്ക് കഴിയും.
നിങ്ങളുടെ സ്വന്തം ഡിജിറ്റൽ അവതാരം (AI Avatars)
നിങ്ങളെപ്പോലെ തന്നെ ഇരിക്കുകയും സംസാരിക്കുകയും ചെയ്യുന്ന ഒരു ഡിജിറ്റൽ പതിപ്പിനെ (Avatar) നിർമ്മിക്കാനുള്ള അവസരവും ഇതിലുണ്ട്. വെറും രണ്ട് മിനിറ്റ് കൊണ്ട് നിങ്ങളുടെ ഫോണിലെ ഫ്രണ്ട് ക്യാമറ ഉപയോഗിച്ച് ഇത് സെറ്റ് ചെയ്യാം. ഇതിനായി ക്യാമറയ്ക്ക് മുന്നിലിരുന്ന് ചില വാചകങ്ങളും നമ്പറുകളും വായിച്ചാൽ മാത്രം മതി. നിങ്ങളുടെ സ്വന്തം ശബ്ദത്തിൽ മറ്റുള്ളവരോട് സംസാരിക്കുന്ന വീഡിയോകൾ നിർമ്മിക്കാൻ ഇത് സഹായിക്കും.സുരക്ഷയാണ് പ്രധാനം (Safety First): ജെമിനി നിർമ്മിക്കുന്ന എല്ലാ വീഡിയോകളിലും സിന്ത് ഐഡി (SynthID) എന്ന അദൃശ്യമായ വാട്ടർമാർക്ക് ഉണ്ടായിരിക്കും. വീഡിയോ മുറിച്ചാലോ ഫിൽട്ടറുകൾ ചേർത്താലോ ഈ അടയാളം മാറില്ല. ഇത് വീഡിയോ എഐ ഉപയോഗിച്ച് നിർമ്മിച്ചതാണെന്ന് തിരിച്ചറിയാൻ സഹായിക്കുന്നു. ആൾമാറാട്ടം തടയാൻ കർശനമായ സുരക്ഷാ സംവിധാനങ്ങളാണ് ഗൂഗിൾ ഒരുക്കിയിരിക്കുന്നത്.
വിലക്കുറവും ലഭ്യതയും (Pricing & Availability)
ജെമിനി ഓമ്നി ഫ്ലാഷ് മേയ് 19 മുതൽ ഗൂഗിൾ എഐ പ്ലസ് (Google AI Plus), പ്രോ (Pro), അൾട്രാ (Ultra) വരിക്കാർക്ക് ലഭ്യമാണ്.
- സൗജന്യ ലഭ്യത: ഈ ആഴ്ച അവസാനത്തോടെ യൂട്യൂബ് ഷോർട്ട്സിലും (YouTube Shorts) യൂട്യൂബ് ക്രിയേറ്റ് ആപ്പിലും ഇത് സൗജന്യമായി എത്തും.
- സബ്സ്ക്രിപ്ഷൻ നിരക്കുകൾ: അൾട്രാ പ്ലാൻ ഇപ്പോൾ മാസം 99 ഡോളർ മുതൽ ലഭ്യമാണ്. ഉയർന്ന ഉപയോഗമുള്ളവർക്കായി 200 ഡോളറിൻ്റെ പ്ലാനുമുണ്ട് (മുൻപ് ഇത് 250 ഡോളറായിരുന്നു).ഡെസ്ക്ടോപ്പ്, ആൻഡ്രോയിഡ്, ഐഒഎസ് (iOS) എന്നീ എല്ലാ പ്ലാറ്റ്ഫോമുകളിലും ഇത് ഉപയോഗിക്കാം.
SarTech Labs എങ്ങനെ സഹായിക്കും?
ഈ സാങ്കേതിക വിദ്യകൾ വെറുതെ കണ്ടു വിടാനുള്ളതല്ല, നമുക്കും ഇവ പഠിച്ചെടുക്കാം. എഐയുടെ ഈ അത്ഭുത ലോകത്തേക്ക് എങ്ങനെ കടക്കാം എന്ന് ആലോചിക്കുകയാണോ? സാങ്കേതിക വിദ്യകൾ ഏറ്റവും ലളിതമായി മലയാളത്തിൽ പഠിക്കാൻ SarTech Labs നിങ്ങളെ സഹായിക്കും.
വീഡിയോ എഡിറ്റിംഗ് എന്നത് പണ്ട് വലിയ സാങ്കേതിക വൈദഗ്ധ്യമുള്ളവർക്ക് മാത്രം സാധ്യമായ ഒരു കാര്യമായിരുന്നു. എന്നാൽ ജെമിനി ഓമ്നിയിലൂടെ സാധാരണക്കാർക്കും മികച്ച ക്രിയേറ്റർമാരാകാൻ സാധിക്കും. വേഗതയേറിയ ജെമിനി 3.5-ഉം സംസാരത്തിലൂടെയുള്ള എഡിറ്റിംഗും വീഡിയോ നിർമ്മാണ മേഖലയെ ആകെ മാറ്റിമറിക്കാൻ പോവുകയാണ്.ഭാവിയുടെ സാങ്കേതിക വിദ്യകൾ മുൻകൂട്ടി പഠിച്ച് മുന്നിലെത്താൻ ഇന്ന് തന്നെ ശ്രമിക്കൂ. ജെമിനിയെക്കുറിച്ചുള്ള നിങ്ങളുടെ സംശയങ്ങൾ താഴെ കമന്റ് ചെയ്യാൻ മറക്കരുത്!എഐ ലോകത്തെ പുതിയ വിശേഷങ്ങളുമായി വീണ്ടും കാണാം!കൂടുതൽ വിവരങ്ങൾക്കും എഐ കോഴ്സുകൾക്കുമായി സന്ദർശിക്കുക: www.sartechlabs.com

