Ching-Chuan Chen's Blogger

部署Spark on Mesos and Cassandra環境

Posted on 2016-08-23 Edited on 2018-03-15 In BigData Disqus:

本篇主要在部署Spark on Mesos的環境

使用scala透過sparkSQL去搬移Oracle DB的資料到Cassandra上

Posted on 2016-08-13 Edited on 2018-03-15 In BigData Disqus:

這篇主要有兩個目的：

幫ROracle澄清其實沒那麼難用，只是要把table name跟column name都轉成大寫，就不會有double quote了
在scala用sparkSQL連ojdbc7，把Oracle資料拉出來，再透過spark-cassandra-connector把資料倒進Cassandra

基於cassandra的spark 2.0.0環境部署 (scala 2.11)

Posted on 2016-08-12 Edited on 2018-03-15 In BigData Disqus:

spark升級到2.0.0，等了幾天

用Nexus建立本地maven倉庫

Posted on 2016-08-10 Edited on 2018-03-15 In BigData Disqus:

sbt每次撈maven跟sbt相關的套件時

都會花很多時間，如果能夠透過本地proxy去降低時間就好了

或是在公司內部網路無法access到外部網路時

就能夠透過proxy去處理這類問題

此時，簡單易用的Nexus就提供很好的協助

基於Cassandra的spark環境部署

Posted on 2016-08-05 Edited on 2018-03-15 In BigData Disqus:

之前的部屬是base on hadoop所建立的spark環境

這一篇會從頭建立基於cassandra的spark環境

用Python將Oracle DB的資料匯出到Cassandra

Posted on 2016-08-01 Edited on 2018-03-15 In BigData Disqus:

基本上的工具在前幾篇都安裝完

這一篇主要目的是把Oracle資料庫的資料匯出到Cassandra中

在centos下部署cassandra

Posted on 2016-07-30 Edited on 2018-03-15 In BigData Disqus:

這篇是我在centos部署cassandra的紀錄

test on apache sqoop

Posted on 2016-07-28 Edited on 2018-03-15 In BigData Disqus:

前四篇分別裝了Hadoop, Oracle, ROracle跟Python的cx_Oracle套件

上兩篇分別利用了ROracle跟cx_Oracle塞了一些資料進去Oracle

接下來是安裝sqoop，試試看用sqoop從Oracle DB把資料撈進HBase

這篇僅是紀錄而已，並沒有成功撈進

在Python用cx_Oracle去操作Oracle資料庫

Posted on 2016-07-26 Edited on 2018-04-21 In BigData Disqus:

前一篇用R去操作了Oracle資料庫

結果不幸發現兩件事情：

表的名字會自動有quote，你預期的表明應該是airlines，會變成”airlines”
column name也會自動有quote，你預期的表明應該是name，會變成”name”

在R用ROracle去操作Oracle資料庫

Posted on 2016-07-25 Edited on 2018-04-19 In BigData Disqus:

前兩篇裝了Hadoop跟Oracle

為了接下來可以測試sqoop，使用ROracle去塞一下資料表進去

在windows下，安裝ROracle，也測試看看在centos下安裝看看

(Note: modified at 2018/04/19)