Google DeepMind présente Nano Banana Pro avec rendu de texte avancé et édition visuelle de qualité studio.
En bref Google DeepMind a lancé Nano Banana Pro, un modèle de génération et d'édition d'images offrant un raisonnement avancé, un rendu de texte amélioré, une composition multi-éléments et bien plus encore.
Google DeepMind, la division IA de Google, a annoncé le lancement de Nano Banana Pro (ou Gemini 3 Pro Image), un modèle de nouvelle génération pour la génération et l'édition d'images. Développé à partir de Gemini 3 Pro, Nano Banana Pro exploite les capacités de raisonnement avancées du modèle et ses connaissances du monde réel pour produire des représentations visuelles plus précises.
Ce modèle est conçu pour prendre en charge un large éventail de tâches visuelles, notamment la conception conceptuelle, la création de prototypes, le développement d'infographies et la conversion de contenu manuscrit en diagrammes structurés. Nano Banana Pro génère des visuels contextuels s'appuyant sur un raisonnement amélioré, des informations externes et des données en temps réel. Gemini 3 Grâce à ses capacités d'analyse, le modèle peut générer des graphiques pédagogiques informatifs, des explications détaillées et des illustrations précises à partir de contenus fournis par l'utilisateur ou d'informations vérifiées issues du monde réel. Il peut également exploiter la recherche Google pour visualiser des éléments tels que des recettes, des bulletins météo en direct ou des informations sportives.
Nano Banana Pro améliore encore le rendu du texte dans les images, offrant une précision, une clarté et une lisibilité accrues dans de nombreuses langues. Le système prend en charge la création de visuels contenant du texte, des étiquettes courtes aux longs passages, tout en interprétant avec précision les nuances stylistiques, la profondeur et la mise en page. Il permet ainsi une intégration plus précise du texte dans les maquettes, les affiches et autres supports créatifs, et facilite la localisation ou la traduction du contenu pour une diffusion plus large.
Ce modèle améliore la fidélité visuelle et la flexibilité créative. Sa conception permet de combiner plusieurs éléments, d'intégrer jusqu'à quatorze images et de conserver une représentation cohérente de cinq personnes au maximum dans une composition. Des tâches telles que la conversion d'esquisses en concepts de produits ou la transformation de plans en rendus 3D détaillés bénéficient de cette cohérence accrue. Nano Banana Pro offre des commandes créatives étendues, permettant aux utilisateurs d'ajuster les perspectives de la caméra, de modifier la mise au point, d'affiner des zones spécifiques d'une image, d'appliquer un étalonnage des couleurs complexe et de modifier les conditions d'éclairage. Les sorties peuvent être générées dans différents formats d'image, avec une prise en charge des résolutions 2K et 4K pour répondre aux exigences de qualité numérique et d'impression.
Nano Banana Pro désormais disponible pour les particuliers, les entreprises et les créateurs
Les utilisateurs à travers Google Les utilisateurs de produits et services peuvent désormais choisir entre le modèle Nano Banana original, conçu pour des retouches rapides et simples, et Nano Banana Pro, destiné aux compositions plus complexes exigeant un rendu visuel de haute qualité. Ce modèle amélioré est progressivement mis à disposition des particuliers et des étudiants via l'application Gemini, en sélectionnant « Créer des images » avec le modèle « Réflexion ». Les utilisateurs de la version gratuite bénéficient d'un accès limité avant de revenir à la version originale, tandis que les abonnés aux formules Google AI Plus, Pro et Ultra profitent de quotas plus importants. Aux États-Unis, Nano Banana Pro est accessible en mode IA pour la recherche pour les abonnés Google AI Pro et Ultra, et est également proposé aux abonnés NotebookLM dans le monde entier.
Pour les utilisateurs professionnels, Google Ads intègre Nano Banana Pro afin de prendre en charge des fonctionnalités plus avancées. création et édition Nano Banana Pro offre des fonctionnalités aux annonceurs du monde entier. Ce modèle est également déployé sur les applications Google Workspace, notamment Google Slides et Vids. Les développeurs et les entreprises pourront l'utiliser via l'API Gemini, Google AI Studio et Google Antigravity pour une génération de mises en page et de maquettes plus riche. Les entreprises peuvent dès à présent l'intégrer à Vertex AI pour la création à grande échelle, et son utilisation sera également étendue à Gemini Enterprise. Les professionnels de la création y auront accès via les abonnements Google AI Ultra dans Flow, l'outil de création de films par IA de Google, ce qui leur permettra d'acquérir une plus grande précision et un meilleur contrôle lors de la mise en forme des scènes et des plans.
Google continue de privilégier la transparence concernant les contenus générés par l'IA. Toutes les images produites via ses outils comportent un filigrane numérique SynthID imperceptible. Les utilisateurs peuvent désormais importer une image dans l'application Gemini et vérifier directement si elle a été générée par l'IA de Google grâce à SynthID. La prise en charge de l'audio et de la vidéo est prévue ultérieurement. En plus de SynthID, un filigrane Gemini visible apparaîtra sur les images créées par les utilisateurs de la version gratuite et de Google AI Pro afin de faciliter leur identification. Pour les flux de travail professionnels exigeant une visualisation optimale, le filigrane visible sera supprimé des images produites par les abonnés à Google AI Ultra et de celles générées dans l'environnement de développement Google AI Studio.
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.
Vous pourriez également aimer
Citi mène à bien un essai historique du processus de règlement des paiements en monnaie fiduciaire vers monnaie numérique en partenariat avec Swift.
En bref Citi et Swift ont mené à bien un essai démontrant la faisabilité du règlement des paiements entre monnaies fiduciaires et numériques à l'aide d'un modèle hybride.

Chainlink devient la solution Oracle privilégiée sur Injective
En bref Injective a intégré Chainlink pour fournir des données de marché en temps réel et une infrastructure permettant des transactions plus rapides. DeFi développement, produits financiers tokenisés et accès élargi aux applications on-chain.

OpenAI Développe ChatGPT Grâce à sa fonction de chat de groupe, jusqu'à 20 utilisateurs peuvent interagir simultanément.
En bref OpenAI vient de déployer sa fonctionnalité de chat de groupe sur tous les niveaux d'abonnement, permettant à un maximum de 20 utilisateurs de collaborer simultanément entre eux et avec d'autres utilisateurs. ChatGPT dans le même fil.

Cysic fournit des preuves ZK plus rapides et plus économiques pour NOYA
En bref Cysic fournit un réseau de calcul complet qui permet la génération de preuves à divulgation nulle de connaissance pour les systèmes d'IA et Web3 applications prenant en charge des charges de travail décentralisées à grande échelle et en temps réel.

