Révolution des Bots alimentée par l'IA : les robots humanoïdes de l'ère ChatGPT arrivent bientôt

La révolution automatisée propulsée par l'IA et le chiffrement : le "moment ChatGPT" des Bots est sur le point d'arriver

L'apparition de ChatGPT a complètement changé la perception des gens sur l'intelligence artificielle. Cependant, le vrai rêve de l'humanité est de permettre à l'IA d'interagir avec le monde physique sous la forme de Bots, comme cela est décrit dans les films de science-fiction.

Une percée majeure dans le domaine des Robots semble imminente. Cet article analysera comment les avancées récentes en intelligence artificielle transforment le paysage industriel, explorera comment les technologies de batterie, l'optimisation des délais et l'amélioration de la collecte de données façonneront l'avenir, ainsi que le rôle que le chiffrement joue dans tout cela. Il mettra également en lumière des domaines dignes d'attention tels que la sécurité des robots, le financement, l'évaluation et l'éducation.

Bots "ChatGPT Moment" : La révolution de l'automatisation alimentée par l'IA et le chiffrement

1. Facteurs clés pour stimuler le changement

percée de l'intelligence artificielle

Les progrès des modèles de langage multimodaux fournissent un "cerveau" pour que les Bots exécutent des tâches complexes. Les Bots perçoivent principalement l'environnement par la vision et l'audition. Les modèles de vision par ordinateur traditionnels excellent dans la détection ou la classification d'objets, mais ont du mal à convertir les informations visuelles en instructions d'action. Bien que les modèles de langage aient d'excellentes performances en compréhension et génération de texte, ils manquent de capacités de perception du monde physique.

Modèle visuel-langage-action ( VLA ) permettant aux Bots d'intégrer la perception visuelle, la compréhension du langage et l'action des entités dans un cadre unifié. En février 2025, un modèle de contrôle de robot humanoïde général publié par une certaine société d'intelligence artificielle a établi de nouvelles normes pour l'industrie grâce à sa capacité de généralisation zéro échantillon et à son architecture à double système. La généralisation zéro échantillon permet aux Bots de s'adapter à de nouveaux scénarios, objets et instructions sans avoir à se réentraîner pour chaque tâche. L'architecture à double système sépare le raisonnement de haut niveau du raisonnement léger, réalisant ainsi des robots humanoïdes commercialisés qui allient pensée humaine et précision en temps réel.

Les robots économiques deviennent une réalité

Les technologies qui changent le monde ont toutes un caractère universel. Quand le prix de certains robots est inférieur à celui d'une berline de milieu de gamme ou du revenu annuel minimum aux États-Unis, imaginer un monde où le travail physique et les tâches quotidiennes sont principalement accomplis par des Bots n'est plus un rêve lointain.

du stockage vers le marché de consommation

La technologie des Bots s'étend des solutions d'entreposage au secteur de la consommation. Ce monde est conçu pour les humains - les humains peuvent accomplir tous les travaux des Bots spécialisés, tandis que les Bots spécialisés ne peuvent pas accomplir tous les travaux des humains. Les entreprises de Bots ne se limitent plus à fabriquer des Bots réservés aux usines, mais développent plutôt des Bots humanoïdes plus polyvalents. Ainsi, la pointe de la technologie des Bots ne se trouve plus seulement dans les entrepôts, mais s'infiltrera également dans la vie quotidienne.

Le coût est l'un des principaux goulots d'étranglement de la scalabilité. L'indicateur clé est le coût global par heure, qui se calcule comme suit : le coût d'opportunité du temps de formation et de recharge, le coût d'exécution des tâches et le coût d'acquisition des Bots, le tout divisé par la durée totale de fonctionnement des Bots. Ce coût doit être inférieur au niveau de salaire moyen de l'industrie concernée pour être compétitif.

Pour pénétrer pleinement le domaine de l'entreposage, le coût global des Bots doit être inférieur à 31,39 dollars de l'heure. Dans le plus grand marché de consommation - le secteur de l'éducation privée et des services de santé - ce coût doit être maîtrisé en dessous de 35,18 dollars. Actuellement, les Bots évoluent vers des solutions moins chères, plus efficaces et plus polyvalentes.

Bots "ChatGPT Moment" : Révolution automatisée propulsée par l'IA et le chiffrement

2. La prochaine percée dans la technologie des Bots

optimisation de la batterie

La technologie des batteries a toujours été un goulot d'étranglement pour les robots conviviaux. L'autonomie de certaines humanoïdes n'est que d'environ 2 heures. Les utilisateurs ne souhaitent clairement pas recharger manuellement tous les deux heures, c'est pourquoi le chargement autonome et l'infrastructure de docking deviennent des axes de développement clés. Actuellement, il existe principalement deux modes de chargement pour les robots : le remplacement de la batterie ou le chargement direct.

Le mode de remplacement de la batterie permet d'effectuer un travail continu grâce au remplacement rapide des batteries épuisées, minimisant ainsi les temps d'arrêt, et est adapté aux scénarios en extérieur ou en usine. Ce processus peut être réalisé manuellement ou de manière automatisée.

La charge par induction utilise une méthode d'alimentation sans fil. Bien que le temps de charge complet soit relativement long, elle permet d'atteindre facilement un processus entièrement automatisé.

optimisation de latence

Les opérations à faible latence peuvent être classées en deux catégories : la perception de l'environnement et le contrôle à distance. La perception fait référence à la capacité des Bots à reconnaître l'espace de l'environnement, tandis que le contrôle à distance se réfère spécifiquement au contrôle en temps réel par un opérateur humain.

Des recherches montrent que les systèmes de perception des Robots commencent avec des capteurs bon marché, mais le véritable avantage technologique réside dans le logiciel d'intégration, le calcul basse consommation et les boucles de contrôle précises en millisecondes. Une fois que les Robots ont terminé le positionnement spatial, un réseau neuronal léger marquera des éléments tels que les obstacles, les palettes ou les humains. Une fois les étiquettes de scène saisies dans le système de planification, des instructions de moteur sont immédiatement générées et envoyées aux pieds, aux roues ou aux bras mécaniques. Un délai de perception de moins de 50 millisecondes équivaut à la vitesse de réflexion humaine - tout délai dépassant ce seuil rendra les actions des Robots maladroites. Par conséquent, 90 % des décisions doivent être prises localement via un réseau unique vision-langage-action.

Les robots entièrement autonomes doivent garantir que le modèle VLA a un délai de moins de 50 millisecondes ; les robots télécommandés exigent quant à eux que le délai de signal entre le poste de commande et le robot ne dépasse pas 50 millisecondes. L'importance du modèle VLA est particulièrement mise en avant ici - si les entrées visuelles et textuelles sont traitées par différents modèles avant d'être introduites dans un grand modèle de langage, le délai global dépassera largement le seuil de 50 millisecondes.

optimisation de la collecte de données

La collecte de données se fait principalement de trois manières : des données vidéo du monde réel, des données synthétiques et des données de télécommande. Le principal obstacle entre les données réelles et les données synthétiques réside dans le fait de combler l'écart entre le comportement physique des Bots et les modèles vidéo/simulés. Les données vidéo réelles manquent de détails physiques tels que le retour de force, les erreurs de mouvement des articulations et la déformation des matériaux ; les données simulées manquent de variables imprévisibles telles que les pannes de capteurs et les coefficients de frottement.

La méthode de collecte de données la plus prometteuse est le contrôle à distance - où les opérateurs humains contrôlent à distance les Bots pour exécuter des tâches. Mais le coût de la main-d'œuvre est le principal facteur limitant la collecte de données par contrôle à distance.

Le développement de matériel personnalisé offre également de nouvelles solutions pour la collecte de données de haute qualité. Certaines entreprises combinent des méthodes traditionnelles avec du matériel personnalisé pour collecter des données sur les mouvements humains en plusieurs dimensions, qui, après traitement, sont transformées en ensembles de données adaptés à l'entraînement de réseaux neuronaux pour Bots, fournissant ainsi une énorme quantité de données de haute qualité pour l'entraînement des Bots avec des cycles d'itération rapides. Ces pipelines technologiques raccourcissent collectivement le chemin de transformation des données brutes vers des Bots déployables.

3. Domaines d'exploration clés

chiffrement technologie et Bots fusion

La technologie de chiffrement peut inciter les parties à confiance réduite à améliorer l'efficacité du réseau de Bots. Sur la base des domaines clés mentionnés précédemment, la technologie de chiffrement peut améliorer l'efficacité dans trois domaines : l'intégration des infrastructures, l'optimisation des délais et la collecte de données.

Le réseau d'infrastructure physique décentralisé ( DePIN ) est prometteur pour révolutionner l'infrastructure de recharge. Lorsque les robots humanoïdes fonctionneront mondialement comme des voitures, les stations de recharge devront être aussi accessibles que des stations-service. Les réseaux centralisés nécessitent d'énormes investissements initiaux, tandis que DePIN répartit les coûts entre les opérateurs de nœuds, permettant une expansion rapide des installations de recharge dans davantage de régions.

DePIN peut également utiliser une infrastructure distribuée pour optimiser la latence de contrôle à distance. En agrégeant les ressources de calcul des nœuds de périphérie géographiquement dispersés, les instructions de contrôle à distance peuvent être traitées par des nœuds locaux ou les plus proches disponibles, minimisant ainsi la distance de transmission des données et réduisant considérablement la latence de communication. Cependant, les projets DePIN actuels se concentrent principalement sur le stockage décentralisé, la distribution de contenu et le partage de bande passante. Bien qu'il existe des projets montrant les avantages de l'informatique de périphérie dans le streaming ou l'Internet des objets, cela n'a pas encore été étendu aux Bots ou au contrôle à distance.

Le contrôle à distance est la méthode de collecte de données la plus prometteuse, mais le coût de l'embauche de professionnels par des entités centralisées pour collecter des données est extrêmement élevé. DePIN résout ce problème en incitant des tiers à fournir des données de contrôle à distance grâce à des jetons de chiffrement. Certains projets construisent un réseau mondial d'opérateurs à distance, transformant leurs contributions en actifs numériques tokenisés, formant un système décentralisé sans autorisation - les participants peuvent à la fois réaliser des bénéfices et participer à la gouvernance tout en aidant à l'entraînement des Bots AGI.

La sécurité reste toujours une préoccupation centrale

L'objectif ultime de la technologie des Bots est d'atteindre une autonomie complète, mais comme le mettent en garde certains films de science-fiction, ce que l'humanité craint le plus, c'est que l'autonomie transforme les Bots en armes offensives. Les problèmes de sécurité des grands modèles linguistiques ont suscité des préoccupations, et lorsque ces modèles acquièrent la capacité d'action physique, la sécurité des Bots devient une condition préalable essentielle à l'acceptation sociale.

La sécurité économique est l'un des piliers de la prospérité de l'écosystème des Bots. Certaines entreprises construisent une couche de coordination décentralisée pour les machines, réalisant l'authentification de l'identité des dispositifs, la vérification de l'existence physique et l'acquisition de ressources grâce au chiffrement. Ce système permet aux Bots de prouver de manière autonome leurs informations d'identité, leur localisation géographique et leurs enregistrements de comportement sans dépendre d'intermédiaires centralisés.

Les contraintes comportementales et l'authentification des identités sont exécutées par des mécanismes on-chain, garantissant que tout le monde peut auditer la conformité. Les Bots conformes aux normes de sécurité, aux exigences de qualité et aux réglementations régionales recevront des récompenses, tandis que les contrevenants feront face à des sanctions ou à une disqualification, établissant ainsi un mécanisme de responsabilité et de confiance au sein du réseau de machines autonomes.

Le réseau de re-staking tiers peut également fournir des garanties de sécurité équivalentes. Bien que le système de paramètres de pénalité doive encore être amélioré, la technologie pertinente est déjà en phase pratique. Il est prévu que les normes de sécurité de l'industrie seront bientôt établies, et à ce moment-là, les paramètres de pénalité seront modélisés en référence à ces normes.

Une possible mise en œuvre est la suivante :

  1. Les Bots d'entreprise rejoignent le réseau de re-staking.
  2. Définir des paramètres de confiscation vérifiables (comme "appliquer une force de contact humain supérieure à 2500 newtons");
  3. Les stakers fournissent une marge pour s'assurer que les Bots respectent les paramètres ;
  4. En cas de violation, la caution sera utilisée comme indemnité pour la victime.

Ce modèle incite les entreprises à placer la sécurité en premier et favorise l'acceptation par les consommateurs grâce au mécanisme d'assurance du pool de fonds de staking.

Bots "ChatGPT Moment" : Révolution d'automatisation propulsée par l'IA et le chiffrement

4. Combler les lacunes de la technologie des Bots

Une entreprise d'IA bien connue a favorisé la popularisation du chiffrement, mais la pierre angulaire de cette percée a déjà été posée. Les services cloud ont brisé la dépendance des modèles à la puissance de calcul locale, les plateformes open source ont permis l'ouverture des modèles, et certaines plateformes en ligne offrent aux ingénieurs en IA des lieux d'expérimentation. Ces percées progressives ont conjointement contribué à la vulgarisation de l'IA.

Contrairement à l'IA, le domaine des Bots est difficile d'accès lorsque les fonds sont limités. Pour réaliser la généralisation des Bots, le seuil de développement doit être réduit au même niveau de commodité que celui du développement d'applications d'IA. Nous pensons qu'il y a des possibilités d'amélioration sur trois niveaux : le mécanisme de financement, le système d'évaluation et l'écosystème éducatif.

Le financement est un point de douleur dans le domaine des Robots. Développer un programme informatique nécessite seulement un ordinateur et des ressources de cloud computing, tandis que construire un Robot pleinement fonctionnel nécessite d'acheter des moteurs, des capteurs, des batteries et d'autres matériels, ce qui fait que le coût dépasse facilement 100 000 dollars. Cette propriété matérielle rend le développement des Robots moins flexible et plus coûteux comparé à l'IA.

L'infrastructure d'évaluation des Bots dans des scénarios réels en est encore à ses débuts. Dans le domaine de l'IA, un système de fonctions de perte clairement défini a été établi, et les tests peuvent être entièrement virtualisés. Cependant, de bonnes stratégies virtuelles ne peuvent pas être directement converties en solutions efficaces dans le monde réel. Les Bots ont besoin d'installations d'évaluation des stratégies autonomes testées dans des environnements réels diversifiés pour réaliser une optimisation itérative.

Lorsque ces infrastructures seront matures, un grand nombre de talents afflueront, et les robots humanoïdes reproduiront la courbe d'explosion du Web2. Certaines entreprises de chiffrement de robots avancent dans cette direction - développant un "système Android version robot", transformant le matériel brut en agents intelligents évolutifs avec une conscience économique. Les modules de vision, de langage et de planification du mouvement pourront être branchés et utilisés comme des applications mobiles, toutes les étapes de raisonnement étant présentées en langage clair, permettant aux opérateurs d'auditer ou d'ajuster le comportement sans avoir besoin de toucher au firmware. Cette capacité de raisonnement en langage naturel permet à une nouvelle génération de talents d'entrer sans couture dans le domaine des robots, franchissant une étape clé vers une plateforme ouverte pour déclencher la révolution des robots, tout comme le mouvement open source a accéléré l'IA.

La densité des talents détermine la trajectoire du secteur. Un système éducatif inclusif et structuré est crucial pour l'approvisionnement en talents dans le domaine des Bots. L'entrée en bourse d'une certaine entreprise de Bots sur le NASDAQ marque le début d'une nouvelle ère où les machines intelligentes participent à l'innovation financière et à l'éducation formelle. Cette entreprise a annoncé en partenariat qu'elle lancera le premier cours d'éducation générale basé sur des robots humanoïdes dans les écoles publiques K-12 aux États-Unis. Ce cours est conçu pour être indépendant de la plateforme, pouvant s'adapter à différents types de formes de robots, et offre aux étudiants des opportunités de pratique.

AGI-2.43%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 1
  • Reposter
  • Partager
Commentaire
0/400
PaperHandsCriminalvip
· Il y a 7h
Les billets commencent déjà à faire signe aux Bots... Quand est-ce que je pourrai ne plus être un pigeon ?
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)