InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Meta社のChameleon AIモデルは、画像・テキスト混合タスクでGPT-4を上回るパフォーマンスを発揮する
Meta社のAI基盤研究(FAIR)チームはこのほど、テキストと画像が混在したコンテンツを理解・生成できる混合モーダルAIモデル「Chameleon」を発表した。人間の審査員によって評価された実験では、Chameleonの生成出力はGPT-4よりも51.6%、Gemini Proよりも60.4%で好まれた。
-
AIとソフトウェア開発:InfoQイベントでのセッションプレビュー
AIはソフトウェア開発の形を変えつつある。InfoQが今後開催するイベントでは、シニア・ソフトウェア開発者が、この変革的テクノロジーに関する実践的なアプリケーションと倫理的な考察を共有する。以下はそのプレビューである。
-
Google I/O 2024を振り返る:Gemini 1.5、Project Astra、AI搭載検索エンジン
Googleは先日、年次開発者会議「Google I/O 2024」を開催し、Googleのアプリやサービスに関する数多くの発表をした。予想通り、AIはこのイベントの焦点であり、ほとんど全てのGoogle製品に組み込まれている。以下は、このイベントでの主な発表の要約である。
-
Slack、ASTと大規模言語モデルを組み合わせて15,000の単体テストの80%を自動変換する
Slackのエンジニアリングチームは先日、 EnzymeからReact Testing Library(RTL)へ大規模言語モデル(LLM)を使って、15,000の単体テストと統合テスト自動変換する方法を発表した。Abstract Syntax Tree(AST)変換とAIによる自動化を組み合わせることで、Slackの革新的なアプローチは80%の変換成功率を達成。必要な手作業を大幅に削減し、複雑な開発作業を合理化するAIの可能性を示した。
-
OpenAI、動作のファインチューニングのためのGPTモデル仕様を公開
OpenAIは最近、GPTモデルの動作に関するルールと目的を記述した文書、Model Specを公開した。この仕様書は、データ・ラベラーやAI研究者がモデルをファインチューニングするためのデータを作成する際に使用することを目的としている。
-
ワシントン大学のAIを搭載したヘッドフォンで、群衆の中の一人の声を聞き取ることが容易に
"ターゲット・スピーチ・ヒアリング "は、ワシントン大学で開発された新しいディープラーニング・アルゴリズムで、ユーザーが話者を"登録"し、その声を取り巻く環境ノイズをすべてキャンセルする。
-
GoogleがChromeにGemini Nanoを導入し、デバイス上で生成AIを実現可能にする
Googleは、開発者向けカンファレンス「Google I/O 2024」において、同社のGeminiモデルの中で最小のGemini NanoをChromeに導入することで、オンデバイスでの大規模言語モデルのサポート実現に向けた取り組みを発表した。
-
Stability AIが3Dモデル生成AI "Stable Video 3D"をリリース
Stability AIはこのほど、1枚の2D画像から3Dメッシュオブジェクトモデルを生成できるAIモデル、"Stable Video 3D"(SV3D)をリリースした。SV3DはStable Video Diffusionモデルに基づいており、3Dオブジェクト生成ベンチマークで最先端の結果を出している。
-
.NETおよびゲーム開発向けIDE "Rider 2024.1":新しいモニタリングツールウィンドウ、コレクションビジュアライザー、.NET Aspire、AIアシスタントプラグイン
JetBrainsは、"Rider 2024.1"をリリースした。このリリースには、新しいモニタリング・ツール・ウィンドウとコレクション・ビジュアライザーが含まれている。また、.NET Aspire、AIアシスタント、およびデバッグに関する機能のプラグインも登場した。
-
トランザクションサーバレスコンピューティング:PostgreSQLの生みの親がDBOSクラウドを発表
DBOSの開発者は最近、TypeScript開発者向けにカスタマイズされたトランザクション・サーバーレス・アプリケーション・プラットフォームであるDBOS Cloudを発表した。すべての状態情報が可用性の高いDBMSに保存されるこの新しいプラットフォームは、トランザクション・サーバーレス・コ��ピューティングを保証し、いわゆる「タイムトラベル」機能とともに信頼性の高い実行を提供する。
-
Uber社、DynamoDBからLedgerStoreに1兆レコードを移行し、年間600万ドルを節約
Uber社は、DynamoDBとblobストレージから新しい長期的なソリューション、LedgerStoreと名付けられた専用のデータストアにすべての支払いトランザクションデータを移行した。同社はコスト削減を模索しており、以前はホットデータ(12週間前のもの)を保存するためのDynamoDBの使用を削減していた。この移行により、大幅なコスト削減とストレージアーキテクチャの簡素化が実現した。
-
あなたの組織に生成AIを導入する前にSDLCを修正しよう:QConロンドンでのBannon氏の行動への呼びかけ
QConロンドンでの基調講演で、MITREのシニアプリンシパル/ソフトウェアアーキテクト兼研究者である Tracy Bannon氏は、AIはソフトウェア開発ライフサイクル(SDLC)を強化できると主張した。彼女はプレゼンテーションを通して、AIを採用する前に人間をループに入れ、自社のSDLCを修正することの重要性を訴え続けた。
-
Amazon Q BusinessとAmazon Q Developerが一般提供開始
AWSはこのほど、企業や開発者向けにカスタマイズされた生成AI搭載のアシスタントAmazon Qの一般提供を発表した。Amazon Q Developerは、リアルタイムでコードの提案や推奨を提供し、Amazon Q Businessは、企業が構造化および非構造化データから洞察を得ることを可能にする。
-
Hugging Face社、ロボット工学のためのオープンソース機械学習モデル「LeRobot」を発表
Hugging Face社は、実世界のロボット工学アプリケーション用に学習された新しい機械学習モデル、LeRobotを発表した。LeRobotはプラットフォームとして機能し、データ共有、視覚化、高度なモデルのトレーニングのための多用途ライブラリを提供する。
-
ベースラインOpenAIエンドツーエンドチャットリファレンスアーキテクチャ
Microsoftは、ベースラインOpenAIエンドツーエンドチャットリファレンスアーキテクチャを公開した。このベースラインには、コンポーネント、フロー、セキュリティに関する情報が含まれている。また、パフォーマンス、モニタリング、デプロイメントガイダンスに関する詳細もある。さらに、Microsoftはソリューションをデプロイして実行するためのリファレンス実装を用意した。