InfiniteWing

Give me a place to stand on, and I will move the Earth

  • 2017-08-27
    Big Data►Competition

    [Kaggle]紅蘿蔔顧客訂單預測─完結

    1. 前言
    2. 心得
    3. 後記
    非關內文

    前言

    Instacart Market Basket Analysis 是一項由美國Instacart公司在Kaggle上發起的資料競賽,主要是希望透過大數據分析的方式,來預測顧客下筆訂單中會出現的商品。這項比賽在2017-08-14時已經結束,由於最近有些庶務要處理,因此雖然我當天就整理好一些參賽心得,一直到今天才想到把它弄上部落格xDD。除了這篇文章以外,我還有另外兩篇關於這項競賽的文章─[Kaggle]紅蘿蔔顧客訂單預測─簡單方法以及[Kaggle]顧客訂單視覺化。

    Read More

    To be continued..
    Posted at 2017-08-27 08:58:11
    Share 留言
    • Big Data
    • Kaggle
    • Notebook
    • 經驗
    2017-08-13
    Big Data►Cloud Computing

    在GCP開啟Ubuntu遠端桌面

    1. 前言
    2. Google Cloud Platform (GCP)
    3. Ubuntu遠端桌面
    非關內文

    前言

    大數據之所以被稱做大數據,自然是因為其資料數量龐大,雖然現今個人電腦普及,但真正面對大數據時,以個人能力組出來的電腦可能無法負荷如此龐大的資料。筆者目前使用的電腦環境是i7-6700 + 16GB DDR4 + NVIDIA 1060 6GB,雖然以個人用途來說已經是很棒的硬體設備,但有時候處理大數據卻會出現OOM或運算速度過慢的問題。對於OOM的問題,最簡單的解決方法就是上GCP開一個RAM大一點的VM,以Ubuntu作業系統來說,8核心+50GB的RAM不到0.5鎂/小時,以GCP提供的300鎂試用額度來說是綽綽有餘。針對深度運算時GPU的不夠力,由於目前GPU租賃單價過高,因此可能日後還要自行添購例如NVIDIA TITAN X之類的高級GPU。

    Read More

    To be continued..
    Posted at 2017-08-13 02:14:20
    Share 留言
    • Big Data
    • Cloud Computing
    • GCP
    • 經驗
    2017-08-08
    Big Data►Competition

    [Kaggle]紅蘿蔔顧客訂單預測─簡單方法

    1. 前言
    2. 競賽說明
    3. 方法說明
    非關內文

    前言

    Instacart Market Basket Analysis 是一項由美國Instacart公司在Kaggle上發起的資料競賽,主要是希望透過大數據分析的方式,來預測顧客下筆訂單中會出現的商品。由於競賽還未結束的關係,因此先簡單介紹我已經開源的方法,日後競賽結束我也會整理相關文件,再將經驗記錄下來。

    Read More

    To be continued..
    Posted at 2017-08-08 09:32:45
    Share 留言
    • Big Data
    • Kaggle
    • Notebook
    • 經驗
    2017-07-29
    Big Data►Deep Learning

    [Kaggle]初探深度學習─亞馬遜叢林辨識(下)

    1. Keras
    2. 亞馬遜叢林辨識
    非關學習

    Keras

    接續前一篇文章,由於深度學習是一項可以畢生鑽研的學問,為了避免事必躬親導致必須沿著前人的路重新走過一次,我們當然要試著站在巨人的肩膀上繼續邁進。

    而Keras這個基於Python語言撰寫的深度學習API,就成為了一個很好的基石。以下節錄Keras的官方中文介紹:

    Read More

    To be continued..
    Posted at 2017-07-29 10:07:06
    Share 留言
    • Big Data
    • CNN
    • Deep Learning
    • Kaggle
    • Keras
    • 經驗
    2017-07-21
    Kaggle►Notebook

    [Kaggle]顧客訂單視覺化

    非關視覺化

    幾天前在Kaggle上建立了人生第一次的iPython筆記(iPython Notebook),主要是處理Instacart Market Basket Analysis這項競賽中,產出每個顧客的歷史訂單視覺化。

    Read More

    To be continued..
    Posted at 2017-07-21 08:50:36
    Share 留言
    • Kaggle
    • Notebook
    • Visualization
    • 第一次
    2017-07-20
    Big Data►Deep Learning

    [Kaggle]初探深度學習─亞馬遜叢林辨識(上)

    1. 前言
    2. 深度學習
    非關深度學習的封面圖

    前言

    大概一個月前開始在Kaggle上接觸有關影像辨識的競賽,一開始我是玩數數海獅有幾隻的這項競賽。

    雖然這是一個物體識別(Object recognition)的競賽,但我當時還未接觸到以深度學習的方式來進行物體識別,僅僅是靠著RGB分群+XGBoost迴歸、以及簡單的Ensemble技巧,勉勉強強爬到了一個只差三名就能拿下生涯第一座銅牌的名次。雖然事後有些懊惱,但這也成為了我接下來參加亞馬遜叢林辨識,以及研究Keras這個Python深度學習套件的因緣。

    Read More

    To be continued..
    Posted at 2017-07-20 12:21:41
    Share 留言
    • Big Data
    • CNN
    • Deep Learning
    • Kaggle
    • Keras
    • 經驗
    2017-07-12
    Big Data►Cloud Computing

    試玩Google Cloud Platform

    1. 前言
    2. Google Cloud Platform
    3. 天下沒有白吃的午餐
    4. 實際測試

    前言

    最近參加了Kaggle上有關影像分類的比賽,於是就開始研究所謂的深度學習影像分類(Deep learning in image classification)。隨著看的文章越來越多,以及接觸了一些深度學習的框架後,我開始佩服當初我買下GTX-1060的衝動。

    當初本來只是想說有朝一日無聊的時候可以玩玩遊戲,壓根還沒意識到原來使用GPU進行深度學習計算已經是如日中天的火熱議題,基本上不會用GPU加速的話,那你大概就跟騎腳踏車跟F1比速度差不多(當然幾乎都是直接請框架幫忙串接GPU,不然光學那些新的東西不曉得要待到何年何月…)

    Read More

    To be continued..
    Posted at 2017-07-12 04:32:19
    Share 留言
    • Big Data
    • Cloud Computing
    • GCP
    • 第一次
    • 經驗
    2017-07-08
    網站設計►Hexo

    Hexo文章相關設定

    1. 前言
    2. 關鍵字的重要性
    3. 圖片資產

    前言

    將我的個人網站push到GitHub上之後,我試著學了Markdown語法,然後也很順利的透過谷哥找到了一款好用的Markdown編輯器─MarkdownPad 2。就在我寫前一篇文章寫到一半的時候,突然想到其他使用Hexo的blogger,他們文章前面好像都會有類似文章目錄的區塊,於是乎我就找了一下有沒有相關的套件可以使用。

    Read More

    To be continued..
    Posted at 2017-07-08 06:01:29
    Share 留言
    • Hexo
    • 經驗
    • 網站設計
    2017-07-07
    FreeBSD►系統防護

    [FreeBSD] 以ssmtp搭配Gamil實現ssh登入自動提醒

    1. 前言
    2. ssmtp
    3. 測試寄信
    4. 偵測ssh登入
    5. 更多的想法

    前言

    俗話說久病成良醫,經過了好幾次的資安經驗後,筆者也慢慢地養成了疑神疑鬼的性格(?),為了避免這種病情惡化,只好用比較聰明的方法來讓自己安心。而這就是以下這篇文章要介紹的,如何透過排程機制來動態偵測ssh的使用者登入狀況,並同步寄發登入提醒。

    說真的既然電腦是架在公開的網路環境下,那就沒有萬無一失的防禦方式,唯有與時俱進及提高警覺才能避免重傷害…所謂不經一事不長一智,久經沙場的話自然就會有更全面的經驗,而筆者也希望自己能從一而終的在學習上永無止境。

    Read More

    To be continued..
    Posted at 2017-07-07 04:58:39
    Share 留言
    • FreeBSD
    • ssmtp
    • 系統防護
    • 資訊安全
    2017-07-06
    網站設計►Hexo

    第一次玩Hexo架站

    1. 前言
    2. 安裝Hexo
    3. Run Hexo
    4. 個人化

    前言

    看了許多人的GitHub Page之後,心頭躍躍欲試。之前一直考慮是要自己重寫一個可以產生靜態網站的程式或是選用現成的網誌工具,最後還是不敵懶惰的天性選擇了許多人使用的Hexo。

    經過一天的努力終於弄好了整個Hexo的環境,修改了一些設定及版面CSS設計後,完成了這個自己的個人網站~

    安裝Hexo

    開始以Hexo(https://hexo.io/zh-tw/)作為靜態網站架站工具前,你的電腦必須支援以下功能:

    • Node.js
    • Git

      Read More

      To be continued..
    Posted at 2017-07-06 06:36:32
    Share 留言
    • Hexo
    • 第一次
    • 經驗
    • 網站設計
    «上一頁123下一頁»

    InfiniteWing

    總覺得我一直在尋覓著什麼

    最新文章

    • [Performance comparison] CSV reader C/C++ V.S. Python - 2020-07-11
    • [Kaggle] Jigsaw Unintended Bias in Toxicity Classification - 2019-06-28
    • [Kaggle] Instant Gratification - A synchronous Kernels-only competition - 2019-06-21
    • 楓之谷APP開發日誌 ─ 小結 - 2018-08-21
    • WSDM - KKBox's Churn Prediction Challenge - 2018-01-01

    分類

    • Big Data13
      • Cloud Computing3
      • Competition8
      • Deep Learning2
    • FreeBSD1
      • 系統防護1
    • Kaggle1
      • Notebook1
    • Performance comparison1
      • C/C++1
        • Python1
    • 個人作品8
      • 楓之谷APP8
    • 網站設計2
      • Hexo2
    • 論文寫作1

    標籤雲

    Android APP8 Big Data13 C/C++1 CNN2 Cloud Computing3 Deep Learning2 Experience1 FreeBSD1 GCP3 Hexo2 KO1 Kaggle11 Keras2 NLP1 Notebook4 Performance comparison1 Python1 Visualization1 WSDM1 ssmtp1 個人作品8 童年8 第一次3 系統防護1 經驗16 網站設計2 論文寫作1 資訊安全1

    彙整

    • 七月 20201
    • 六月 20192
    • 八月 20181
    • 一月 20181
    • 十二月 20171
    • 十一月 20171
    • 十月 20171
    • 九月 20171
    • 八月 20174
    • 七月 20177
    • 二月 20171
    • 一月 20172
    • 十一月 20151
    • 十月 20152
    • 九月 20151
    © 2021 InfiniteWing all rights reserved.
    Powered by Hexo
  • Home
  • About
  • Archives
  • Work
  • Gallery
  • Private