InfiniteWing

Give me a place to stand on, and I will move the Earth

  • 2020-07-11
    Performance comparison►C/C++►Python

    [Performance comparison] CSV reader C/C++ V.S. Python

    1. 前言

    前言

    隨著科技日新月異,人類每天生活都會產生數以百PB,甚至上EB的資料;撇除那些未系統化的資料,作為一名數據科學家平時最常接觸到的資料不外乎是CSV/TSV/XML/JSON等等結構化的資料。

    Read More

    To be continued..
    Posted at 2020-07-11 03:01:10
    Share 留言
    • C/C++
    • Experience
    • Performance comparison
    • Python
    2019-06-28
    Big Data►Competition

    [Kaggle] Jigsaw Unintended Bias in Toxicity Classification

    1. 前言
    2. 比賽說明
    3. EDA
    4. Models
    5. 小結

    前言

    隨著前次 [Kaggle] Instant Gratification - A synchronous Kernels-only competition 比賽的落幕,我在短暫的休息了一天後又馬不停蹄地繼續開啟下一個比賽。之所以這麼樣的汲汲營營,並不只是為了想在短時間內學到許多新東西,更重要的原因在於這比賽只剩不到一周的時間就要結束了…身為一名標準的工程師,死線往往能成為推進他前進的原動力,所以我就參賽啦~

    Read More

    To be continued..
    Posted at 2019-06-28 05:48:45
    Share 留言
    • Big Data
    • Kaggle
    • NLP
    • 經驗
    2019-06-21
    Big Data►Competition

    [Kaggle] Instant Gratification - A synchronous Kernels-only competition

    1. 前言
    2. 比賽說明
    3. EDA
    4. Models
    5. Validation方式
    6. Stacking
    7. 小結

    前言

    自五月底退伍重返人間後,經歷了一周的面試之旅,發覺到自己在資訊領域最感興趣的還是資料科學。為了充實一下自己的履歷、同時也為了填補將近半年多的空缺,我決定上Kaggle找幾個比賽來訓練自己,順便看看能不能拿個Master稱號XDD。以下將介紹我選擇的其中一個比賽「Instant Gratification - A synchronous Kernels-only competition」的比賽經驗。

    Read More

    To be continued..
    Posted at 2019-06-21 11:44:54
    Share 留言
    • Big Data
    • KO
    • Kaggle
    • 經驗
    2018-08-21
    個人作品►楓之谷APP

    楓之谷APP開發日誌 ─ 小結

    小結!

    畢竟現在每天都要碼字,多餘的字就不加贅述(苦笑),以下直接放影片囉~

    Read More

    To be continued..
    Posted at 2018-08-21 04:01:28
    Share 留言
    • Android APP
    • 個人作品
    • 童年
    2018-01-01
    Big Data►Competition

    WSDM - KKBox's Churn Prediction Challenge

    1. 心得
    2. 解法思路
    非關內文

    好吧,既然我都把去年十二月的文章發布了,那乾脆趁著還有熱情與記憶的時候,先把去年底完成的競賽心得寫一寫吧!關於競賽的目標,簡單來說,我們要做的就是預測KKBOX的會員在會員期限到期後三十天內是否會續訂。首先直接上官方關於這項比賽的說明:

    The 11th ACM International Conference on Web Search and Data Mining (WSDM 2018) is challenging you to build an algorithm that predicts whether a subscription user will churn using a donated dataset from KKBOX. WSDM (pronounced “wisdom”) is one of the the premier conferences on web inspired research involving search and data mining. They’re committed to publishing original, high quality papers and presentations, with an emphasis on practical but principled novel models.

    WSDM - KKBox's Churn Prediction Challenge

    Read More

    To be continued..
    Posted at 2018-01-01 12:00:00
    Share 留言
    • Big Data
    • Kaggle
    • WSDM
    • 經驗
    2017-12-13
    Big Data►Cloud Computing

    在GCP安裝python3,運作pytorch

    1. 1.安裝python3
    2. 2.安裝cuda
    3. 3.安裝cudnn
    4. 4.安裝tensorflow
    5. 5.安裝常用套件
    6. 6.小記錄
    非關內文

    好吧,這篇說是十二月中寫的,但實際上二月初我才發布…老實說我快忘了要保持一個月至少一篇日誌的習慣,雖然說墮落是人類的原罪,但為什麼人非得汲汲營營呢?嗯,因為這是個無解的命題,所以我就發發牢騷,以下會記錄我當初如何在GCP開啟pytorch並實現python3的環境,當初找資料找了許久,因為GCP的ubuntu預設是python2,對於伸手黨來說大部分的資料都是python3…。

    Read More

    To be continued..
    Posted at 2017-12-13 06:22:48
    Share 留言
    • Big Data
    • Cloud Computing
    • GCP
    • 經驗
    2017-11-30
    Big Data►Competition

    [Kaggle] Text Normalization Challenge - English Language

    1. 前言
    2. 心得
    非關內文

    前言

    月底了,心中一直想著要再記錄一下,於是我終於抽空寫了十天前就結束的Text Normalization Challenge 的心得(其實只是懶 =3=)。
    這項競賽一樣是在Kaggle上發起的競賽,根據競賽描述,我們要設計能將文章語句轉換成口說語法的機器學習模型,舉個例子:

    Read More

    To be continued..
    Posted at 2017-11-30 03:42:24
    Share 留言
    • Big Data
    • Kaggle
    • 經驗
    2017-10-19
    Big Data►Competition

    [Kaggle] Carvana Image Masking Challenge

    1. 前言
    2. 心得
    非關內文

    前言

    恩,果然都是要到月初我才會想起上個月還沒有保持至少發一篇文章的事情…算了,反正發文日期可以自己調整。
    回歸正題,這次要記錄的是在Kaggle上的一項競賽 ─ Carvana Image Masking Challenge。顧名思義,我們要做的事情就是幫內含一部車輛的圖片,找出適合的遮罩,讓圖片只留下車子。

    Read More

    To be continued..
    Posted at 2017-10-19 10:28:31
    Share 留言
    • Big Data
    • Kaggle
    • 經驗
    2017-09-30
    Big Data►Competition

    [Kaggle] Porto Seguro’s Safe Driver Prediction

    1. 前言
    2. 心得
    非關內文

    前言

    Porto Seguro’s Safe Driver Prediction 是一項由巴西知名保險公司在Kaggle上發起的競賽,希望藉由精準預測明年各保戶是否會索取保險求償,從而調整不同客戶的保險金額。

    Read More

    To be continued..
    Posted at 2017-09-30 02:08:12
    Share 留言
    • Big Data
    • Kaggle
    • Notebook
    • 經驗
    2017-08-29
    論文寫作

    論文寫作簡介

    1. 前言
    2. 論文
    3. 實用網站
    非關內文

    前言

    在結束了Kaggle上的紅蘿蔔顧客訂單預測比賽後,我赫然發現最後的暑假(?)似乎已經到了尾聲。雖然暑假參加了六七項的大數據比賽,同時也學了許多有趣的工具,但心中總有種不切實際的感覺,一種「啊,時間就這樣過去了!」的感嘆…。扯遠了,結束比賽後我弄了一下計畫有關的東西,接著就進入了碩士的最後課題:畢業論文。

    Read More

    To be continued..
    Posted at 2017-08-29 10:03:18
    Share 留言
    • 經驗
    • 論文寫作
    123下一頁»

    InfiniteWing

    總覺得我一直在尋覓著什麼

    最新文章

    • [Performance comparison] CSV reader C/C++ V.S. Python - 2020-07-11
    • [Kaggle] Jigsaw Unintended Bias in Toxicity Classification - 2019-06-28
    • [Kaggle] Instant Gratification - A synchronous Kernels-only competition - 2019-06-21
    • 楓之谷APP開發日誌 ─ 小結 - 2018-08-21
    • WSDM - KKBox's Churn Prediction Challenge - 2018-01-01

    分類

    • Big Data13
      • Cloud Computing3
      • Competition8
      • Deep Learning2
    • FreeBSD1
      • 系統防護1
    • Kaggle1
      • Notebook1
    • Performance comparison1
      • C/C++1
        • Python1
    • 個人作品8
      • 楓之谷APP8
    • 網站設計2
      • Hexo2
    • 論文寫作1

    標籤雲

    Android APP8 Big Data13 C/C++1 CNN2 Cloud Computing3 Deep Learning2 Experience1 FreeBSD1 GCP3 Hexo2 KO1 Kaggle11 Keras2 NLP1 Notebook4 Performance comparison1 Python1 Visualization1 WSDM1 ssmtp1 個人作品8 童年8 第一次3 系統防護1 經驗16 網站設計2 論文寫作1 資訊安全1

    彙整

    • 七月 20201
    • 六月 20192
    • 八月 20181
    • 一月 20181
    • 十二月 20171
    • 十一月 20171
    • 十月 20171
    • 九月 20171
    • 八月 20174
    • 七月 20177
    • 二月 20171
    • 一月 20172
    • 十一月 20151
    • 十月 20152
    • 九月 20151
    © 2021 InfiniteWing all rights reserved.
    Powered by Hexo
  • Home
  • About
  • Archives
  • Work
  • Gallery
  • Private