データエンジニア庵原さんが現地参加で学んだ「Snowflake Summit 2025」勉強会レポート

こんにちは、primeNumberです。

2025年6月2日から5日にかけて、Snowflakeが主催する年次カンファレンス「Snowflake Summit 2025」が開催されました。

https://www.snowflake.com/en/summit/

総参加数は約2万人以上という過去最大規模となったSnowflake Summit2025に、primeNumberからはプロフェッショナルサービス本部のシニアマネージャーとシニアデータエンジニアを兼務する庵原さんが参加。イベントで得た知見を社内勉強会という形でメンバーに共有してくれました。

なお、庵原さんは期間中にSnowflakeのイベントレポートもたくさん発信しています。この記事中でも関連するレポートを紹介しますので、興味のある分野は合わせてお読みください。

データ基盤のカバレッジを大きく広げているSnowflake

イベントを運営するSnowflakeから発信されたメッセージの中で、庵原さんは大きく3つの重要なテーマがあると説明。1つ目は「SIMPLICITY」で、複雑性がリスクやコスト、摩擦を生むため、Snowflakeではシンプルさを設計の中心に据えているとのことです。

2つ目アーキテクチャや経済性、AI活用といった様々なテーマにおいて、これまでは「I want」だったのが今では「You can」に、つまり「欲しい」ではなく「自分でできる」という時代が来たというのがSnowflakeの考えです。

また、「AIデータクラウド」を掲げるSnowflakeは、データとAIを統合的に使えるサービスとしてSnowflakeを進化させるという方針を示した上で、「EASY(簡単)」「CONNECTED(接続性)」「TRUSTED(信頼性)」というキーワードを明示し、「シンプルさを保ちながら他のサービスやデータとの接続性を高め、信頼性も担保する」というメッセージを掲げました。

これらSnowflakeの方向性に対して庵原さんは「あくまで自分が受け取った感想」と断った上で「Snowflakeはデータ基盤のエコシステムをすべて飲みこもうとしている」と分析。「今までは貯められたデータをいかに高速に処理するかという部分が強みだったが、今後はそれに対して適切にdataを取得したりAIを活用したり、カタログ機能などをSnowflake単体でできるようにしている」と補足しつつ、「革新的な発表というよりもSnowflakeがやってきたことの集大成だ」と付け加えました。

「魔法のような」データ活用も。Snowflake Summitの気になるリリースをピックアップ

Snowflake Summitで発表された100を超えるリリースのうち、庵原さんはprimeNumberに関係する内容をカテゴリごとに紹介してくれました。

データエンジニアリング関連では、Snowflake上でApache NiFiが動作し、データの構造化や連携方法を問わずにデータ統合できる「Snowflake OpenFlow」を紹介。魅力的な機能ですが現在はプレビュー段階のため、SPCS(Snowpark Container Services)または自前のインスタンスが必要という制約があり、運用面での課題も残っているとしました。

https://zenn.dev/primenumber/articles/cbe681c4c958c5

その他にもSnowflakeでdbt IDEが利用できる「dbt Project on Snowflake」、リアルタイムデータ取り込みサービス「Snowpipe」を刷新して料金体系を改善した「Snowpipe Streaming V2」を紹介。Snowpipeは今回の刷新により最大で50%のコスト削減になるそうです。

https://zenn.dev/primenumber/articles/7e55876170a8ab

プラットフォーム関連の話題では、Snowflakeに接続するサービスやデータを1つのUIで管理できるデータガバナンス「Horizon Catalog」、処理の重さを自動判定してウェアハウスのサイズ選択も自動化する「Adaptive Compute」を紹介。さらに総合運用性の強化として、Snowflake以外のサービス連携をシームレスにするためにIcebergも強化しており、多くのクエリエンジン、カタログ間でのRead / Write両方の対応が実現されています。

https://zenn.dev/primenumber/articles/6aa632ad3b7570

近年注目の集まるAIについてもさまざまな発表がありましたが、中でも庵原さんが「まるで魔法のようだ」と評した「Cortex AISQL」は、SQLを使って構造データとマルチモーダルデータを意味的(Semantic)に結合できる機能。具体的には顧客の問い合わせ文章と解決方法の文書を意味的にマッチングしたり、ID情報と画像データを意味的に結合することができます。

Snowflake Semantic Viewは、事前定義したFact / Dimテーブルの結合方法を事前定義するビュー、Semantic IntelligenceはHorizon Catalogや自作したCortex Search、Cortex Analyst(Semantic Model)を1つの画面からアクセスできるUIサービスで、どちらもSQLを用いたユーザーライクなデータ分析を行うための機能です。

Data Science Agentは、まだプライベートプレビューで「ベールに包まれている謎のもの」と断ったうえで、データや分析要件を理解して自律的に動作するデータサイエンティストと説明。「このテーブルを使って売上予測してください、とお願いするだけで作業をすべて裏側で自動的にやってくれる」と具体例を示しました。

https://zenn.dev/primenumber/articles/be5cc29ce525c6

最後に庵原さんは「Snowflakeがカバレッジを大きく広げている」とのメッセージを再度示した上で、「今はまだ発表されたばかりの段階のものも多く、実用性や運用面での課題も残っています」と指摘。AIについては引き続き注目すべきであるものの、まだAIだけで何かができるというほどではなく、この分野はまだ人の力が必要になるだろうとの見解を示し、これからのAI時代へ向けてprimeNumberの持つ武器を改めて考える必要があると参加者に問いかけました。