Cartes immersives, recherche AR, Pixel 7 et plus • The Register

IO de Google Google I/O, la conférence annuelle des développeurs publicitaires, est revenue mercredi au Shoreline Amphitheatre de Mountain View, en Californie, pour la première fois en trois ans. La réunion est restée en grande partie un événement éloigné en raison de la persistance de COVID-19, bien qu’il y ait eu divers Googleurs, partenaires et développeurs de logiciels présents pour remplir les sièges de la salle et ponctuer les points clés d’applaudissements.

Sundar Pichai, PDG d’Alphabet, société mère de Google, a ouvert la discussion avec des thèmes familiers. Il s’est penché vers le sentiment implicite, “Nous sommes là pour vous aider”, une proposition de plus en plus douteuse à la lumière des nombreuses controverses auxquelles l’entreprise est confrontée.

Il a dit qu’il voulait expliquer comment Google fait avancer sa mission de deux manières, “en approfondissant notre compréhension de l’information afin que nous puissions la transformer en connaissance, et en faisant progresser l’état de l’informatique afin que la connaissance soit plus facile d’accès, peu importe qui”. tu es.”

La vidéo d’ouverture transmettait une version plus succincte du message : “La technologie a le pouvoir d’améliorer la vie de chacun. Il suffit de la construire”, était le thème.

Et Google a construit des choses, pour le meilleur ou pour le pire. Pichai a annoncé 24 langues sur Google Translate, qu’il a attribuées aux progrès de l’apprentissage automatique qui peuvent résoudre la longue traîne des langues sous-représentées.

“Avec les progrès de l’apprentissage automatique, nous avons développé une approche monolingue où le modèle apprend à traduire une nouvelle langue sans jamais en voir une traduction directe”, a-t-il déclaré. “En collaborant avec des locuteurs natifs et des institutions, nous avons constaté que ces traductions étaient d’une qualité suffisante pour être utiles.”

Pichai est passé à Google Maps et a décrit comment l’entreprise utilise la vision par ordinateur pour générer des modèles de construction à partir d’images satellites.

“Grâce aux progrès de l’apprentissage automatique de la cartographie 3D, nous fusionnons des milliards d’images aériennes et de rue pour créer une nouvelle représentation haute fidélité d’un lieu”, a-t-il expliqué. “Ces technologies innovantes s’associent pour offrir une nouvelle expérience cartographique appelée visualisation immersive. Elle vous permet d’explorer un lieu comme jamais auparavant.”

La démonstration vidéo pendant la conférence montrait une vue aérienne de l’intérieur d’un restaurant. Ce qui est remarquable à propos de la scène, c’est qu’elle n’a pas été filmée à l’aide d’un drone, mais a été générée à l’aide d’un logiciel de rendu de réseau neuronal analysant des images fixes. L’aperçu immersif fonctionne même sur les appareils mobiles et sera diffusé à Los Angeles, Londres, New York, San Francisco et Tokyo plus tard cette année, avec d’autres villes plus tard.

Google met gratuitement sa technologie d’étiquetage de scène Live View à la disposition des développeurs ARCore via son API géospatiale. Et il étend également son éco-routage à Maps.

“Des routes vertes ont déjà été lancées aux États-Unis et au Canada et les gens les ont utilisées pour parcourir 130 milliards de kilomètres, contribuant à économiser près d’un demi-million de tonnes métriques d’émissions de carbone, l’équivalent de retirer 100 000 voitures de la route”, a déclaré Pichai. . “Je suis heureux de partager que nous étendons cette fonctionnalité à plus d’endroits, y compris l’Europe plus tard cette année.”

L’IA aide la star de la vidéo

Sur YouTube, les chapitres générés automatiquement pour les vidéos devraient passer de huit millions aujourd’hui à 80 millions l’année prochaine. Et la reconnaissance vocale est appliquée aux vidéos pour créer des transcriptions vidéo qui sont désormais disponibles pour les utilisateurs d’Android et d’iOS.

Il en va de même pour les sous-titres traduits automatiquement. Pichai a déclaré que les sous-titres traduits automatiquement seront appliqués au contenu ukrainien sur YouTube le mois prochain dans le cadre d’un effort plus large visant à accroître l’accès à des informations précises sur la guerre russo-ukrainienne.

Google AI est récemment arrivé dans Google Docs via le récapitulatif automatique. “Cela marque un énorme bond en avant pour le traitement du langage naturel”, a déclaré Pichai. “Cela nécessite une compréhension passe-longue, une compression des informations et une génération de langage qui étaient auparavant hors des capacités des meilleurs modèles d’apprentissage automatique, et Docs n’est que le début.”

Cette fonctionnalité tl;dr est désormais disponible dans Spaces.

La fascination de The Chocolate Factory pour l’IA est également évidente dans les améliorations de l’espace de travail telles que la “lumière de portrait” qui permettra aux utilisateurs d’applications comme Google Meet de simuler la présence de lumières dans la pièce et la “restauration de portrait” pour améliorer automatiquement la qualité de l’image vidéo. .

Pour améliorer la présentation des divers tons de peau dans les images, Google a ouvert la Monk Skin Tone Scale (MST), un cadre pour un rendu des couleurs plus précis développé en collaboration avec le professeur et sociologue de Harvard, le Dr Ellis Monk.

Prabhakar Raghavan, vice-président senior de Google, a pris la parole pour parler de diverses améliorations de la recherche. La fonctionnalité de recherche multiple récemment introduite – où l’utilisateur capture une image et ajoute du texte pour découvrir des informations spécifiques sur la chose représentée – est en train d’être modifiée pour gérer le paramètre “près de moi”, afin de renvoyer des résultats pertinents localement. Cette fonctionnalité devrait apparaître en anglais plus tard cette année.

Prabhakar Raghavan, vice-président principal de Google

Prabhakar Raghavan sur Google IO … Cliquez pour agrandir

Une autre innovation dans un futur proche est le “balayage de scène”, grâce auquel les chercheurs pourront visualiser une scène avec une caméra d’appareil mobile et obtenir des informations spécifiques sur chaque élément de la scène, comme le pourcentage de cacao dans chaque barre de chocolat de la scène. .

Google Assistant a appris à répondre sans la phrase de réveil “Hey Google”. À partir d’aujourd’hui, le Nest Hub Max basé aux États-Unis peut répondre lorsqu’il est analysé et adressé, pour ceux qui se sont inscrits et ont réussi les vérifications de correspondance faciale et vocale. L’appareil répondra également à un nombre limité de phrases rapides telles que “Réglez une minuterie sur cinq minutes” sans “Hey Google”.

Android 13 beta est apparu, maintenant en version 2. Il comprend un nouveau sélecteur de photos avec des autorisations multimédias plus granulaires, une autorisation de notification, et plus tard cette année, il inclura une page de paramètres de sécurité et de confidentialité unifiée. Il est également livré avec des améliorations de tablette et de personnalisation.

Sameer Samat, vice-président de la gestion des produits chez Google, a souligné la prise en charge d’Android 13 pour RCS (Rich Communication Services), une mise à jour de la messagerie SMS qui inclut le cryptage de bout en bout. “Nous nous attendons à ce que chaque système d’exploitation mobile reçoive le message et passe à RCS”, a déclaré Samat. “Ainsi, vos messages sont privés, quel que soit l’appareil que vous utilisez.”

Pratique, au moins pour la sécurité, plus l’oreille et le poignet

Sur le plan matériel, le Pixel 6a de Google sera disponible en précommande, à partir de 449 $, le 21 juillet, avec une disponibilité prévue pour le 28 juillet. Il est disponible en Chalk, Charcoal et Sage et partage le matériel utilisé pour les Pixel 6 et 6 Pro. Les clients bénéficient de cinq ans de mises à jour de sécurité, mais pas de ports 3,5 mm.

Brian Rakwoski, vice-président de la gestion des produits, a présenté en avant-première les prochains Pixel 7 et 7 Pro, attendus plus tard cette année.

“Vous pouvez voir que nous avons étendu la finition en aluminium à l’ensemble de la barre de caméra pour la prochaine évolution du langage de conception des pixels”, a-t-il déclaré. “Le boîtier et la barre de l’appareil photo sont fabriqués à partir d’une seule pièce d’aluminium 100 % recyclé et le magnifique Pixel Seven Pro et son système à trois caméras établissent une toute nouvelle norme en matière de photographie, de performances et de design.”

Le Pixel 7, a-t-il dit, utilisera le SoC Google Tensor de nouvelle génération et sera lancé avec Android 13.

En parlant de tendeurs, il a été fait mention de huit pods Google TPUv4 AI Accelerator dans un centre de données de l’Oklahoma, fournissant environ neuf exaflops de puissance de calcul agrégée aux clients de Google Cloud afin que les chercheurs et les entreprises puissent obtenir le même type de calcul que Google utilise pour votre travail interne d’IA.

Il a également été question de Pixel Buds Pro, d’améliorations de Google Wallet et d’un aperçu de Google Pixel Watch.

La sécurité et la confidentialité ont reçu une certaine attention, avec des améliorations de l’interface utilisateur telles que l’affichage des messages d’état de sécurité du compte pour le compte Google, l’extension de la détection du phishing et des logiciels malveillants Gmail à Google Docs, Sheets et Slides, l’enregistrement automatique de la vérification en deux étapes (2SV) et des cartes de paiement virtuelles pour Android et Chrome cet été.

Pichai a conclu la conversation avec un clin d’œil aux applications de réalité augmentée comme Google Lens, la recherche multiple, l’exploration de scènes et la vision immersive comme moyen d’améliorer le monde réel – ce qui est tentant de lire comme une démission multimilliardaire du PDG de Meta, Mark Zuckerberg. misez sur la réalité virtuelle déroutante et tâtonnante.

“Ce potentiel est ce qui nous passionne le plus dans la RA : la possibilité de passer du temps à se concentrer sur ce qui compte dans le monde réel, dans nos vies réelles”, a déclaré Pichai. “Vous savez, le monde réel est incroyable.” ®

Leave a Comment