ショートリードの憂鬱 - 次世代シーケンサー

第2世代高速シーケンサー（Illumina, SOLiD, 454）とそのアプリケーションについて。できるだけ最新に近いことと、トレンド、面白いと思った論文やアプリケーションを書いています。シーケンサーに興味のあるひとは是非覗いていってください。コメントも大歓迎です。　一分子シーケンサー　PacBioについては、姉妹ブログ「パックマンの挑戦　http://pacbiobrothers.blogspot.com/　」　を、10X Genomicsについては「くろみうんの冒険」を覗いてみてください！

2020年1月16日木曜日

イルミナの新しいシークエンサー　NextSeq1000・2000

2020年のイルミナ新製品は、NextSeq1000・2000でしたか。
そうですかー、ミドルサイズのシークエンサーをバージョンアップしたんですね。

私は正直、もっとハイエンドのクラスを行ってくるかと思っていたのですが、ベンチトップクラスを狙ってくるとは。でも、だんだんと種類が増えてきて、エンジニアは大変だろうなぁと想像します。

この装置はミドルクラスのようでいて、ちょっと前のHiSeqやMiSeqのいいとこ取りをしている気がします。

イルミナ社提供のカタログより抜粋

50bp x2、100bp x2、150bp x2で読めるそうです。
またNovaSeq 6000で採用している整列化フローセルと同じ技術を採用しているため、高密度なクラスター形成が可能になったとのこと。

もう１つ、追加機能として、リードマッピングのような二次解析がでできる、DRAGENが内蔵されている。
このDRAGEN、覚えているかたもいるでしょうか？　こちらで昔紹介したFPGA搭載の超高速解析サーバーですよ。ブログの方は１、２、３とシリーズ化しています。てか、DRAGEN紹介したのは2015年か！　そんなに昔だったのかぁ

私が前職、トミーデジタルバイオロジーにいた頃にこのDRAGENを作っていたEdicogenome社に出会い、日本で販売した頃はまだワークステーションの形でした。
そのうちブレードサーバーの形になり、あちこちのゲノムセンターに納品されるようになった。
やがてイルミナがEdico社を買収し、約2年後に、彼らのシークエンサーシステムの中に組み込まれたわけです。

この、シークエンサーの中にDRAGENを組み込みたい、というアイデア自体は、私が2015年にEdicoのお偉いさんと話した時に聞きました。でもその時はもちろん、別会社でしたから「夢」みたいな話だったのですが、5年後に実現してしまいましたね。

それにDRAGENはもっとハイスループットのNGSに組み込まれた方がその威力（スピード）を存分に発揮できるから、多分、次に出てくるハイエンド装置はDRAGEN標準装備になるのでしょう。本当に、笑っちゃうくらい速いですから。最初、「嘘でしょ？もう終わったの？」となります（自分でBWAとかのマッピングをやったことあるひとは）。
ということで個人的には、NextSeq1000、NextSeq2000　の次も注目したい！

2019年11月16日土曜日

「組織上の位置情報を保存したRNA-Seq」のウェビナーのお知らせ　11月19日

これはNGS、それもショートリードのRNA-Seqアプリケーションだからお知らせしますね。

NGS現場の会、シングルセルゲノミクス研究会、のメーリスでも流れましたが、11月19日（火）の午後2時からVisium Spatial Transcriptomicsの日本語ウェビナーを行います。登録サイトはこちらから

登録サイトはこちらから

で、そもそもVisium って何？　ってかたがいると思いますが、これは in situ hybridization とRNA-Seqの両方を合体させたようなイメージです。

組織の凍結切片を用意する（組織により異なるがおよそ10μmの厚さ）
切片を特殊なスライドガラスの上に載せる
H&E染色する
Permebilization処理をして組織に穴を空け、mRNAをガラスの上に落とす
ガラス上に敷き詰められているオリゴのポリdT配列でmRNAを捉える
ガラス上でmRNAを逆転写し、cDNAを作る
cDNAを回収、増幅し、NGSライブラリを作る
NGSシーケンスをする
データ解析

ここで肝となるのはガラス上のキャプチャーオリゴ。これにはガラス上に（キャプチャーエリアという１辺６.５mmの正方形の中に）敷き詰められている約５０００のスポットには、それぞれ住所IDが付いていて、そのIDごとに異なるバーコード配列がオリゴに含まれている。

cDNAを作る時に同時にそのバーコード配列も取り込まれ、NGSで読まれます。

遺伝子（mRNA、cDNA）の部分的な配列（３’側）、と
スポットごとに異なるIDのバーコード配列

の両方を同時に取得します。（ペアエンドで読むので）

１で遺伝子の発現がわかり、２でその遺伝子がどのスポットから得られたのか、がわかる

つまり、どの遺伝子がどのくらい、組織のどこで発現していたのか、が同時にわかる。

カタログはこちらから落とせます

で、そのウェビナーが火曜にあるんですね。

日本語でやるので多くの人に聞いてもらいたい。時間の都合がつかない方はレジストだけでもしてもらえれば後でビデオなり資料なりのお知らせが行くと思います。

まさに、次世代の発現解析、ですよ。そしてこれは来年、もっともっとメジャーになることは間違いありません。

ちなみに、これのソフトウェアについてのウェビナーも21日の12時から（これは英語ですが）行われます。こっちはまず19日のウェビナーの内容を知っているのが前提で進められますので、両方の参加をオススメします。

2019年6月4日火曜日

10x Genomics のユーザーグループミーティングのお知らせ　６月28日

今日はせっかくなんでこっちのブログでも宣伝、10x Genomics ユーザーグループミーティング（東京）のお知らせです！

これ、昨年は10月に行いました。今年は早くも6月28日に東京で行います。
今年は、午前中はサンプル調整・データ解析ワークショップ、午後はお客様の発表、というようにしました。
午前中のワークショップは、基本プレゼンベースです。10xのユーザーを想定しています。10xの前提知識が無いと聞いていてもわからないだろう、と思うからです。

午後のセッションは一般の方（シングルセルに興味のある方）を対象にした、いわゆるユーザーミーティングです。もちろんユーザー以外の方でもウェルカムです。みなさんどんな研究に10xのChromiumを使っているか、興味ありますよね。

-------------------【ユーザーの演者の皆さま】-------------------

Garvan Institute of Medical Research, Laboratory Head, Dr. Alex Swarbrick
Landscape of the Breast Cancer Microenvironment at Single-Cell Resolution

熊本大学ヒトレトロウイルス学共同研究センター, 佐藤賢文先生　
HTLV-1感染病態解明へ向けた感染者血液のシングルセルトランスクリプトーム解析

富山大学医学部整形外科/Duke University Orthopaedic Surgery, 箭原康人先生
scRNA-seqを用いたRNA velocity解析；胎児卵黄嚢 erythro-myeloid progenitor由来破骨細胞は造血幹細胞非依存的に生ずる

東京大学大学院新領域創成科学研究科，鈴木絢子先生
scATAC-seq/scRNA-seq解析:がん細胞のトランスクリプトーム不均一性解明に向けて
----------------------------------------------------------------------------

ご覧の通り、がんの微小環境、免疫、遺伝子発現、ATAC-Seqなどテーマが多彩に渡ります。また、10xからは、製品アップデート、Spatial、データビューワーの話、さらに当日データ解析ヘルプデスクも設ける予定です。

あと、今回初の試みとして、ライトニングトークセッションを行います。
これは一人5分の発表です。最大６名まで募集します。参加者枠はまだ少しあるので何か発表したい、共同研究者を探したい、という人は是非どうぞ。

ユーザー会が終わった後は情報交換会（という名の懇親会）がありますので是非どうぞ。すべて無料です。何かプレゼント的な、何かがあるかも。

10x Genomics ユーザーグループミーティングの登録はこちら

2018年7月30日月曜日

10X Genomicsラブのブログ開始（ちょっと更新）

PacBioのブログの姉妹版、くろみうんの冒険を始めました。
ゲノムとシングルセル解析のグローバルリーダー、10X Genomics をもっともっと知ってもらうために、頑張って続けていこうと思います。
くろみうんというのは、10xの装置、Chromiumをカッコ良く発音するとそう聞こえるからです。

あー、7年ぶりにショートリードの世界に戻ってきました。
こっちは憂鬱、なんていうタイトルをつけてしまいましたが、10Xの方は憂鬱にならないように、明るいタイトルにしました。

みなさんどうぞ宜しくお願いしまっす！
あ、そうだ、10xではアプリケーションのテクニカルサポートを募集中（2018年8月現在）です。
結構やりがいがあると思います。自由度高いです。英語できる人歓迎します。オフィスに通う必要ありません。ストックオプションもらえます。出張多いです。そんな働き方が好きな方はぜひお知らせ下さい！　詳細はこちら

2018年2月12日月曜日

クリニカルシークエンスの知識シェアリングは日本で流行るか？　SOPHiA Genetics

皆さん、SOPHiA GENETICSという会社、ご存じですか？
スイスに本社があり、ヨーロッパとアメリカ大陸を中心に、55か国にビジネスを拡大したクリニカルシークエンスのベンチャー企業です。

ITのスペシャリストを集めて始めたこの会社は、最初は他の多くの解析ベンチャーと同じく、NGSのデータをマッピング⇒SNPコーリング⇒変異解析、そしてアノテーションという解析パイプラインをクラウド上で行うシステムを作っていました。

この会社がわずか3年で400の病院にシステムを導入し、クラウド上で登録している患者さんのサンプル数は約17万人分に達した理由は、他の企業にはあり得ない、データシェアリングというアイデアをシークエンス解析に応用していること！

なんと‼　データシェアリング⁉　を、クリニカルシークエンスに応用⁉

データシェアリングといっても配列ファイルをシェアするわけではありません。
このクラウド上の解析パイプラインは、SOPHiA DDM (Data Driven Medicine)と呼ばれます。

ユーザはFastqファイルをSOPHiA DDMクラウドにアップします。
するとアライメント、SNVs検出、変異解析は自動で行われます。

変異解析に必要なのは、見つけた変異に疾患関連性があるか無いか？ですよね。 pathogenic, begin, unknown significance とか、聞いたことがあるひともいると思います。
この疾患関連性のアノテーションは普通、健常人でも見られるSNVsをフィルタリングした後、世界中の「変異と疾患の関連性」データベースに照らし合わせて行われます。
一般的なのは、ClinVarなど信頼ある公共データベースをもとに、既知のPathogenicisty情報をアノテーションする方法。

今までの考え方では、他のユーザがアノテーションしたSNVs情報は、そのユーザまたは共同研究機関の内部だけでシェアされるのが普通でした。
ところがSOPHiA DDMの中では、全世界のほかのユーザがアノテーションし、判断したPathogenicistyの情報をシェアできるのです！

ACCESS TO CLINICAL GENOMICS COMMUNITY
SOPHiA GENETICS has built the World's Largest Clinical Genomics Community with hundreds of institutions worldwide participating in the democratization of Data-Driven medicine. Through SOPHiA DDM, thousands of experts can easily interpret the variants and flag them with the appropriate level of pathogenicity. This highly valuable information feeds the variant knowledge base and is anonymously and safely shared among the members of the community.

もちろん、ユーザがアップロードしたサンプルの配列情報や、患者情報、疾患情報はシャアされません。
シェアされるのは、「遺伝子Aの変異Vが、疾患などのフェノタイプDと関連する」というアノテーション情報のみ。
この情報と数多くの公共DB情報、さらに日々追加される膨大なNGSデータ、これらを今はやりのAIで解析し最高精度のアノテーションを行うのが、SOPHiA DDMです。

そうなってくるとデータのセキュリティが心配になりますよね。
でもそこは心配ご無用！　世界で最も厳しい、EUの一般データ保護規則（GDPR: General Data Protection Regulation）に準拠しているそうです。
さらにISO 13485（医療機器・体外診断用医薬品）、ISO/IEC 27001（情報セキュリティ）も取得済み。

このビジネスモデルは、ヨーロッパやアメリカではかなり受け入れられており、今イケイケの成長企業です。
ビジネスの範囲もデータ解析だけでなく、上流の疾患遺伝子パネルの開発や、トレーニングの実施、顧客ラボのISO取得コンサルティングなど多岐にわたっています。
ちなみに2017年の50 SMARTEST COMPANIESで見事30位になっていますよ！
（テスラモーターが31位、オックスフォードナノポアが32位、マイクロソフトが27位）

クラウドでのクリニカルNGSデータ解析ということと、変異解釈のデータシェアリングというアイデアが、日本ですぐに受け入れられるかどうかはわかりません。
ですが世界では確実に主流になっていくような気がしました。私の勘ですが。

2017年11月4日土曜日

DRAGEN　名実共に世界最速のNGSサーバに！　ギネスブックに載ったぜい！

今気付いたんですが、このブログの前回の記事が昨年のASHGだったんですね。
それもEdicogeonme社、DRAGENの話。
偶然ですが今回の記事もASHG、それもDRAGENの話！

ついに、ギネスブックに載ったぜ！

このニュースはすごいと思いません？
真ん中にいるジャケット来たかたがギネスのおっさんです。

どういうことでギネスに載ったのか、というと、1000人分のヒトゲノムを最高スピードで解析するシステム、ということらしいです。
私もちゃっかり記念撮影

Edicoの夜のパーティにはたくさんひとが集まり、盛り上がりました。
昨年はバンクーバーで、今年はオーランド。
バンドの生演奏やもちろんタダ飯＆タダビール。もちろんプレゼンもこんな感じに、真面目にやってました。

さて、Edicogenome社のホームページに行ったかたは気づいたかも知れませんが、Dragenがクラウドサービスを始めました。
具体的にはDNA Nexusのパイプラインを使っていて、DNA NexusはAWSを使っている、というわけですが、現在はアメリカだけのサービスです。
残念ながら、AWSとの大人の事情で、日本ではクラウドサービスの予定は未定なんです。

というわけで日本ではハードウェアがありますのでどうぞ宜しくお願いします！

このギネスの話を拡散したら、問い合わせがあちこちから来ました。
日本のクリニカルシークエンスにも、Dragenサーバが使われる日も近い、かな。

2016年10月21日金曜日

アメリカ人類遺伝学会　ASHG　Edicogenomeの日

2016年10月19日、バンクーバーにて

今日はEdicogenomeの日。というのは私が勝手につけたのですが、朝7時からのモーニングセッションに始まり、昼間は展示会場のブース、夜7時からのパーティーに至るまで、Edico社にかかりっきりな1日だったので。

Edico社といえば、あの、超高速NGS解析サーバ・Dragenを売っている会社。
何といっても、FPGA、集積回路に直接「マッピング→変異解析パイプライン」を書き込んでいるから、文字通り超高速で解析ができる。

モーニングセッションでは、Hudson AlphaやBaylerなどから一線の研究者が集まり、Precision Medicineに超高速NGS解析はどう貢献するか、というテーマでディスカッションされました。

パネルディスカッションの様子

朝7時ですよ。
こんな早いモーニングセッションは初めて

個人的には、Dragenサーバは、クリニカルシークエンス時代の解析プラットフォームの標準となる、可能性は高いと思います。
FDAの認証を受ける働きをしている各研究機関では、解析パイプラインの中に、Dragenサーバを組み込んでいました。（Edico社主催のセミナーだからリップサービスはあると思いますが、客観的な立場でもDragenを褒めていました）
Edico社も当然、Precision Medicine時代にDragenサーバが採用されるべく、着々と準備を重ねているようです。

演者のひとり、Ray氏が言っていた、「Focus on science, Not infrastructure 」というのが印象的でした。
Dragenは一種のインフラです。解析インフラです。
大掛かりなクラスターサーバをそろえて、メンテナンスすることに巨額な予算を振り分けるより、その分をサイエンスに与えるべきだ。という主張です。
医者や研究者が多いこの学会では「受ける」言葉ですね。

あえて付け足すとすれば、現代のゲノミクスはテラバイト、ペタバイトの規模。
でもエクサバイトの時代がすぐそこまできていることを想定すると、DragenがあってもITエンジニアは必要で、それなりに予算を振り分ける必要はあると思いますけどね。

Dragenサーバは、たった1つのブレードなので、単純な作りです。
ハードなのでいつか壊れますが、その時は部品を交換するだけ。
既存のGATKパイプラインの結果に合わせたければ、そのようにチューニングできます。
Edico社の経験豊富なエンジニアに頼んで、いくらでもカスタマイズできます。
実際、Hudson Alphaでは、自分たちに使いやすいようににカスタマイズしているそうです。

そうやって精度を合わせれば、あとはスピードの勝負。
30xのヒト全ゲノム解析が20分、Exomeが1分、で完了という世界です。

夜のパーティでは、場所を旧Bank of Canadaの建物に移し、クラウドサービスの発表がありました。

壁に映してのプレゼン

Edico社のCEO

まだクラウドサービスの開始時期は未定ですが、IBM社と組んでいますので、本気です。

GUIもまもなく出来上がります。これは結構使いやすくなる感じ

名前にちなんだ、Dragon Breathという、スペシャルカクテルがこちら

ドライアイス入りの強めカクテル

長い1日でした・・・。

登録: 投稿 (Atom)