こんにちは、Yです。
今日はデータ分析の公開講座についての話です。
東京大学グローバル消費インテリジェンス寄付講座(GCI)に参加しました。
【GCI】東京大学グローバル消費インテリジェンス寄付講座に参加!
東京大学グローバル消費インテリジェンス寄付講座

GCI講座の概要
この講義は東大工学部の松尾研などが主宰する無料の講座です。
コースの概要
大量のデータを自由自在に解析・分析し、隠れた関係性を発見する。そんなスキルを身につけた「データサイエンティスト」に対する需要は、工学分野だけならず、医療・経済・経営・ライフサイエンスなど非常に多くの分野で高まる一方です。
本コースでは、あらゆる分野で武器になるデータの解析・分析スキルのコアとなる機械学習およびビッグデータを扱う技術、分析結果を効果的に可視化する技術の基盤を網羅的に身につけ、一人前のデータサイエンティストとして活躍する入り口に立つことを目指します。
参加の目的は、心理系の研究でデータ分析を使えるようにすることでした。
特に、テキスト分析ができるようになりたいと考えていました。
GCIのカリキュラム・日程
●(2020-2021冬の)カリキュラム・日程
・ライブ配信時間: 18:45〜20:30
(アーカイブ動画をご視聴いただくことでも出席扱いといたします。)第1回(10/7) 導入
第2回(10/14) Python基礎
第3回(10/21) Pythonによる科学計算(Numpy)
第4回(10/28) Pythonによるデータ加工処理の基礎(Pandas)
第5回(11/4) データサイエンスにおけるデータの可視化(Matplotlib),確率統計の基礎
第6回(11/11) SQL
第7回(11/18) 機械学習の基礎(教師あり学習)
第8回(11/25) 機械学習の基礎(教師なし学習)
第9回(12/2) モデルの検証方法とチューニング方法
第10回(12/9) 特徴量エンジニアリング
第11回(12/16) 自然言語処理
第12回(12/23) ゲスト講師
第13回(1/6) ゲスト講師
第14回(1/13) ゲスト講師
初日の感想
今日は講座の第1週、初回授業日でした。
今日の授業の内容は、講座の全体説明とデータサイエンスの概要について。
内容的には工学・情報系の勉強で、プログラミングや数学が必須です。
「私はプログラミングや数学の経験は少ないですが、頑張ります。これからが楽しみです!」
と思っていました。
GCI終盤の感想
追記 : 2021年1月13日
講座も終盤になりましたので追記します。
これまでGCIの授業はライブで見たり録画で見たりしていました。
レベル感
やはり内容(プログラミングや数学)は難しく、ついて行くのは大変でした。
初心者歓迎の講座ではありますが、(大学の理系の)初心者歓迎というレベル感です。
文系で数学やプログラミングの経験が少ない方は苦労すると思います。
未経験でも素養があればついていける講座ですが、素養というのは実質才能だと感じました。
もし数学やプログラミングが苦手な人が受講するなら、高校・大学の数学の基礎とPythonの文法は受講前にできるようにしておくことをおすすめします。
*大学の数学といっても範囲が広いため、機械学習に関わる分野だけでいいです。主に確率と統計。
講座の内容
講座ではSlackで連絡をとっていました。
講座の初回授業の前にメールがきて、Slackに招待されます。
そのあとはSlackで連絡をとり、東大松尾研の授業用サイトで講義や課題にアクセスしました。
この授業用サイトは講座参加者が事前に登録したGitHubアカウントでログインします。
外部からはアクセスできないと思います。
毎回、授業後にアンケートがありました。
アンケートに回答すると翌週の講義を見る権利が与えられます。
演習はGoogle Colaboratoryで行いました。



Google ColaboratoryはブラウザからPythonを記述、実行できるサービスです。
次の特長を備えています。
・環境構築が不要
・GPU への無料アクセス
・簡単に共有
授業の内容はPythonの基礎と機械学習、機械学習の応用がメインです。
この講座の内容を理解して自分でも精度高めの予測ができるようになれば企業でインターンすることもできると思います。
講座は映像授業とGoogle Colabの演習が主ですが、機械学習のコンペ(Kaggle)にも参加します。
いきなりコンペと聞くと驚かれる方もいらっしゃるでしょうが、Kaggleには初心者向けの解説もあるので大丈夫です。
ただ、機械学習は技術の進歩が速いため常に最新の技術を学び続ける必要があります。
そのためKaggleで一定の成績を修めることをカリキュラムに入れるのは仕方ないことだと思います。
よって、この講座ではKaggleに挑戦し一定のスコアを修めることが求められました。
ただ授業を受けるだけでは修了できないため、難易度はそれなりにあります。
おそらく授業内容は日本で受けられる無料講義のなかではトップクラスにいいものだと思います。
所要時間
毎週、一定時間を勉強に費やすことが求められます。
大学の理系の授業一個分か二個分以上の重さがあります(個人の感想)。
講座の期間中はプログラミング経験者や得意な人以外はかなり集中しないといけないでしょう。
私は大学の授業と課外活動との両立を考えましたがかなり大変でした。
「数学やプログラミングが趣味です」という人以外は余暇の多くをこの講座に費やすくらいの気持ちで挑んでもいいと思います。
講座の長所と短所
ここで改めて長所と短所を考えてみました。
長所
・Kaggleがカリキュラムに含まれており実践的な講座である
・ゲスト講義でデータサイエンスを実務(ビジネス)にどう活用するか知ることができる
・Slackが参加者同士のコミュニティになりモチベーションが上がりやすい
短所
・強いていうなら修了の難易度が高いこと
本気でやりたい人にはおすすめ
なぜこんなに素晴らしい講義が無料で受けられるかというと、寄付講座だからでしょう。
ちなみに、この講座を修了するといいことがあるそうです。
気になった方は次回もし開催されたら申し込んでみてください。
申込は簡単で、Googleフォームに名前、所属、プログラミング経験、志望動機などを記入するものでした。
私はプログラミング経験は少ない方でしたが、動機が明確だったため参加できたのだと思います。
講座は毎年夏と冬に開講しているようですので、要チェックです。
講義が本になったもの↓
コメント