From bd702abdd9ec4aaaffe807d2e0046a512bfb7a7a Mon Sep 17 00:00:00 2001
From: Michael <mzhang@Administrators-MacBook-Pro-2.local>
Date: Mon, 21 Nov 2016 10:08:35 -0800
Subject: [PATCH] Readme

---
 README.md | 83 ++++++++++++++-----------------------------------------
 1 file changed, 21 insertions(+), 62 deletions(-)

diff --git a/README.md b/README.md
index 3b2dbfc..d85cbe6 100644
--- a/README.md
+++ b/README.md
@@ -28,27 +28,21 @@ the sessions are found.
 
 Install Hadoop
 ----------------------------------------------------------------
+Examples below are tested with Aerospike Java Client (version: 3.3.0) and Hadoop (version: 2.7.2)
 
-    export HADOOPVER=2.5.1
+Hadoop installation guide [link](https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html)
 
-    cd /usr/local/dist
-    wget http://mirrors.ibiblio.org/apache/hadoop/common/stable/hadoop-${HADOOPVER}.tar.gz
-    cd /usr/local
-    tar xvfz /usr/local/dist/hadoop-${HADOOPVER}.tar.gz
-    ln -s hadoop-${HADOOPVER} hadoop
-    
-    # Add default FS in /usr/local/hadoop/etc/hadoop/core-site.xml
+Then set up environment variable: 
+----------------------------------------------------------------
 
+    Hadoop Installation Directory:
     export HADOOP_PREFIX=/usr/local/hadoop
 
-
-Development Directory
-----------------------------------------------------------------
-
+	Development Directory:
     export AEROSPIKE_HADOOP=~/aerospike/aerospike-hadoop
 
 
-Building w/ Gradle
+Build w/ Gradle
 ----------------------------------------------------------------
 
     cd ${AEROSPIKE_HADOOP}
@@ -65,12 +59,6 @@ Building w/ Gradle
     ./gradlew :examples:external_join:installApp
 
 
-Building w/ Maven (instead)
-----------------------------------------------------------------
-
-    cd ${AEROSPIKE_HADOOP}
-    mvn clean package
-
 
 Setup Target Input Text File
 ----------------------------------------------------------------
@@ -84,8 +72,7 @@ Setup Target Input Text File
 Start Aerospike
 ----------------------------------------------------------------
 
-    cd ~/aerospike/aerospike-server
-    make start
+    sudo /etc/init.d/aerospike start
 
 
 Setup Sample Data in Aerospike for Input Examples
@@ -104,7 +91,7 @@ Setup Sample Data in Aerospike for Input Examples
         localhost:3000:test:integers:bin1 seq-int 0 100000
 
 
-Running Input Examples
+Run Input Examples
 ----------------------------------------------------------------
 
     export HADOOP_PREFIX=/usr/local/hadoop
@@ -193,20 +180,15 @@ Setup Sample Data in HDFS for Output Examples
     $HADOOP_PREFIX/bin/hdfs dfs -rm -r /worldcup
     $HADOOP_PREFIX/bin/hdfs dfs -mkdir /worldcup
     $HADOOP_PREFIX/bin/hadoop fs -copyFromLocal \
-        $HOME/aerospike/doc/data/WorldCup/wc_day52_1.log \
-        /worldcup/wc_day52_1.log
-    $HADOOP_PREFIX/bin/hadoop fs -copyFromLocal \
-        $HOME/aerospike/doc/data/WorldCup/wc_day52_2.log \
-        /worldcup/wc_day52_2.log
+        data/worldcup\
+        /worldcup/access.log
 
     # Create the secondary indexes in Aerospike.
-    ~/aerospike/aerospike-tools/asql/target/Linux-x86_64/bin/aql \
-        -c 'CREATE INDEX useridndx ON test.sessions (userid) NUMERIC'
-    ~/aerospike/aerospike-tools/asql/target/Linux-x86_64/bin/aql \
-        -c 'CREATE INDEX startndx ON test.sessions (start) NUMERIC'
+    aql -c 'CREATE INDEX useridndx ON test.sessions (userid) NUMERIC'
+    aql -c 'CREATE INDEX startndx ON test.sessions (start) NUMERIC'
 
 
-Running Output Examples
+Run Output Examples
 ----------------------------------------------------------------
 
     # Run the Hadoop job.
@@ -221,8 +203,7 @@ Running Output Examples
         /tmp/words
 
     # Inspect the results:
-    ~/aerospike/aerospike-tools/asql/target/Linux-x86_64/bin/aql \
-        -c 'SELECT * FROM test.counts'
+    aql -c 'SELECT * FROM test.counts'
 
     # -- OR --
 
@@ -233,12 +214,10 @@ Running Output Examples
         -D aerospike.output.namespace=test \
         -D aerospike.output.setname=sessions \
         -D mapred.reduce.tasks=30 \
-        /worldcup/wc_day52_1.log \
-        /worldcup/wc_day52_2.log
+        /worldcup/access.log
 
     # Inspect the results:
-    ~/aerospike/aerospike-tools/asql/target/Linux-x86_64/bin/aql \
-        -c 'SELECT * FROM test.sessions'
+    aql -c 'SELECT * FROM test.sessions'
 
     # -- OR --
 
@@ -249,12 +228,10 @@ Running Output Examples
         -D aerospike.output.namespace=test \
         -D aerospike.output.setname=profiles \
         -D mapred.reduce.tasks=30 \
-        /worldcup/wc_day52_1.log \
-        /worldcup/wc_day52_2.log
+        /worldcup/access.log
 
     # Inspect the results:
-    ~/aerospike/aerospike-tools/asql/target/Linux-x86_64/bin/aql \
-        -c 'SELECT * FROM test.profiles'
+    aql -c 'SELECT * FROM test.profiles'
 
     # -- AND --
 
@@ -267,28 +244,10 @@ Running Output Examples
         -D aerospike.output.namespace=test \
         -D aerospike.output.setname=sessions2 \
         -D mapred.reduce.tasks=30 \
-        /worldcup/wc_day52_1.log \
-        /worldcup/wc_day52_2.log
+        /worldcup/access.log
 
     # Inspect the results:
-    ~/aerospike/aerospike-tools/asql/target/Linux-x86_64/bin/aql \
-        -c 'SELECT * FROM test.sessions2'
-
-Running the Spark Session Rollup Example
-----------------------------------------------------------------
-
-    # Start Spark.
-
-    cd ${AEROSPIKE_HADOOP}/examples/spark_session_rollup
-
-    # Run the example    
-    java -jar build/libs/spark_session_rollup-1.0.0-driver.jar
-
-    # Inspect the results:
-    ~/aerospike/aerospike-tools/asql/target/Linux-x86_64/bin/aql \
-        -c 'SELECT * FROM test.sessions3'
-
-    # Stop Spark.
+    aql -c 'SELECT * FROM test.sessions2'
 
 
 Done with HDFS