it's me/๐ฉ๐ป ํ๋ก์ ํธ ์ ๋ฆฌ
-
[Quadcore Team/Trend] ์ธ๊ธฐ ํธ์ ๋ญํนit's me/๐ฉ๐ป ํ๋ก์ ํธ ์ ๋ฆฌ 2020. 3. 2. 18:50
์ด์ ์์ผ ์ฌ๋ฆฌ๋ ํ๋ก์ ํธ ์ ๋ฆฌ 2... * ์ธ๊ธฐ ํธ์ ๋ญํน ์ถ์ถ ๊ณผ์ 1) Cassandra to Spark ์นด์ฐ๋๋ผ์ raw data ์ค ๋ฆฌํธ์ ๋ data ์ถ์ถ ( ์ฌ๋ผ์ค๋ ํธ์ ์ค 80% ์ด์์ด ๋ฆฌํธ์ ๋ฐ์ดํฐ) ํ์ฌ์๊ฐ ๊ธฐ์ค 30์ด ์ ๊น์ง data ์ถ์ถ if __name__ == "__main__": while True: # ํ์ฌ์๊ฐ ๋ง์ดํฌ๋ก ์ธ์ปจ์ฆ ๊น์ง current_time = int(time.time() * 1000000) # ํ์ฌ์๊ฐ ๋ง์ดํฌ๋ก ์ธ์ปจ์ฆ ๊น์ง # redis ์ ์ฅ ํฌ๋งท ์๊ฐ ํ์ ( ๋ /์/์ผ/์/๋ถ) ์ผ๋ก current_time_format = datetime.datetime.fromtimestamp(int(current_time/1000000)).strftime('%Y/%m/%..
-
[Quadcore Team/Trend]ํด์ํ๊ทธ ๋ถ์it's me/๐ฉ๐ป ํ๋ก์ ํธ ์ ๋ฆฌ 2020. 2. 26. 16:15
๋ฏธ๋ฃจ๊ณ ๋ฏธ๋ฃจ๋ค ์ด์ ์์ผ ์ฌ๋ฆฌ๋ ํ๋ก์ ํธ ์ ๋ฆฌ 1... * Hashtag Ranking ๊ณผ์ 1) raw tweet ์ ์ฒ๋ฆฌ raw tweet df ์ค 'entities.hashtags.text' ์ถ์ถ ( ํด์ํ๊ทธ column ๋ง ์ถ์ถ ) rdd ๋ก ๋ง๋ ํ collect()๋ฅผ ํตํด ๋ชจ๋ row ํ๋์ ๋ฆฌ์คํธ ์์ ์ ์ฅ๋๋๋ก ํ๊ธฐ def process(rdd): try: rawTweet = spark.read.json(rdd) #creates an in-memory table that is scoped to the cluster in which it was created. rawTweet.registerTempTable("tweets") hashtag = rawTweet.selectExpr('entities..
-
[4์ฃผ์ฐจ] - word count with Sparkit's me/๐ฉ๐ป ํ๋ก์ ํธ ์ ๋ฆฌ 2020. 2. 1. 02:39
์๋ฒ๊ฐ๋ฐ์บ ํ 4์ฃผ์ฐจ์ธ ์ด๋ฒ์ฃผ๋ถํฐ๋ ๋ณธ๊ฒฉ์ ์ผ๋ก ํ ํ๋ก์ ํธ๋ฅผ ์์ํ๋ค. 4์ฃผ์ฐจ ๋์ Milestone : spark ํ์ฉํ์ฌ word count ๋ก ๋จ์ด ๋ถ์ + api ์ค๊ณ ์คํํฌ ์ฑ 2.3์ฅ ํ์ต ์คํํฌ ์ฑ 12.13์ฅ ํ์ต ์คํํฌ ์ฑ 21์ฅ ์คํธ๋ฆฌ๋ฐ ์ฒ๋ฆฌ ํ์ต ์ค์๊ฐ์ผ๋ก ๋ฐ์ดํฐ ๋ฐ์์์ word count ์คํ ์ด ์ค api ์ค๊ณ๋ฅผ ์ ์ธํ๊ณ ๋ ๊ทธ๋๋ ๋ค ์งํํ๋ค ! โญ๏ธ ์ด๋ฒ์ฃผ ์ ๋ฆฌ Spark - word count Spark ์์๋ ๊ธฐ๋ณธ์ ์ผ๋ก kafka flume kinesis Tcp sockets ํ์ผ ์์คํ ex) hdfs , s3 ... ์ผ๋ก๋ถํฐ data source ๋ค์ ๋ฐ์์ฌ ์ ์๋ค. ๋๋ ์์ง kafka ์ฐ๊ฒฐ์ ํ์ง ์์๊ธฐ ๋๋ฌธ์ Tcp socket ํต์ ์ ์ด์ฉํ์ฌ twitter api..
-
QuadCore Team Projectit's me/๐ฉ๐ป ํ๋ก์ ํธ ์ ๋ฆฌ 2020. 2. 1. 01:39
์ฐ๋ฆฌ์ ํ๋ก์ ํธ ๋ฐ ๊ทธ ์ค ๋ด๊ฐ ๋งก๊ฒ ๋ ๋ถ๋ถ๋ค ... ์ด์ ์์ผ ๋ธ๋ก๊ทธ์ ์ฌ๋ฆฐ๋ค. ํญ์ ๋ ธ์ ์๋ง ์ ๋ฆฌํด๋๊ณ ๋ธ๋ก๊ทธ์ ํ๊บผ๋ฒ์ ์ฌ๋ฆฌ๋ ค๋ ์ฝ์ง ์๋ค ์ฐ๋ฆฌ ํ MSA ์ํคํ ์ฒ ์ด ์ค์์ ๋๋ ํธ๋ ๋ ๋ถ๋ถ์ ๋งก์์ ์งํํ๋ค. โญ๏ธ ์ ๋ฆฌ ๋ชฉ์ฐจ What ? ์ด๋ค ๊ฒ ํ๊ณ ์ถ์ด / ์ด๋ค ๊ฒ ๋ง๋ค๊บผ์ผ? ๋ชฉํ ์ ์ ๊ธฐ๋ฅ ์ ์ Why ? ์ ํ๋ ค๊ณ ํ๋๋ฐ ? ํ๊ณ ์ถ์ ์ด์ ๊ทธ๊ฒ์ ํตํด ๋ด๊ฐ ์ป๊ณ ์ ํ๋ ๊ฒ How ? ์ด๋ป๊ฒ ํ ๊ป๋ฐ? ์ํคํ ์ฒ ์ค๊ณ ๊ตฌ์ฒด์ ์ธ ๊ธฐ๋ฅ ๋ช ์ธ ์ฌ์ฉ ํด / ์ธ์ด Milestone 1.2.3 What ๋ชฉํ : ์ค์๊ฐ์ผ๋ก ๋ค์ด์ค๋ ๋ง์ ์์ Raw Data ์ค ์๋ฏธ์๋ Data ๋ค์ ์ ์ํ๊ณ ์ ํํ๊ฒ ์ ๋ฌํ๊ณ ์ถ๋ค ! ๊ธฐ๋ฅ : ํ๋ง๋๋ก ์ ์ํ์๋ฉด ๋ฐ์ดํฐ ์์ง ๋ฐ ๊ฐ๊ณต + ํธ๋ํฝ ์ฒ๋ฆฌ Twitter AP..
-
Authorization Systemit's me/๐ฉ๐ป ํ๋ก์ ํธ ์ ๋ฆฌ 2020. 1. 15. 01:02
์ฌ์ค ํ๋ก์ ํธ๋ฅผ ๋ค ๋๋ธ ํ ํ๊บผ๋ฒ์ ๋ฉ์ฐ๊ฒ ์ ๋ฆฌํ๊ณ ์ถ์์ง๋ง,, ๊ทธ๋ฌ๊ธฐ์ ๋๋ฌด ์์ด ๋ง์ ๊ฒ ๊ฐ์์ ์ด๋๊น์ง ์งํํ ๋ถ๋ถ ๋ถ๋ถ ์ ๋ฆฌํด์ ์ฌ๋ฆฌ๊ธฐ๋ก ํ๋ค. ๊ธฐ๋ณธ์ํคํ ์ณ client (react) ↔ server (node.js) ↔ mysql (db) ์บ์์ฒ๋ฆฌ Redis Node.js ์์ mysql ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ ๊ทผ ๋ฐฉ๋ฒ connection ๊ฐ์ฒด ์์ฑํ์ฌ ๊ทธ ๊ฐ์ฒด๋ฅผ ์ด์ฉํด DB์ ํต์ connection ์ค์ ์ config ํด๋ ๋ด์ ์ ์ฅ 3. connection ์์ฑํ๋ ๋ฐฉ๋ฒ createConnection() ๋งค๋ฒ connection ์์ฑ → ๋นํจ์จ์ (์์ฑ๋ ๋ ๋ง์ ์๊ฐ ์์๋๊ธฐ ๋๋ฌธ) createConnection() ๋ฉ์๋๋ฅผ ํตํด connection ๊ฐ์ฒด ํ๋ ์์ฑ ์ข ๋ฃ: connection...