Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- Dense_Rank
- 회귀분석
- 여러 데이터 검색
- Intersect
- 막대그래프
- sql
- max
- count
- loop 문
- 그래프시각화
- %in%
- 빅데이터
- sqld
- Sum
- 불순도제거
- merge
- 회귀분석 알고리즘
- if문 작성법
- 상관관계
- 데이터분석
- 정보획득량
- 히스토그램 그리기
- 순위출력
- 단순회귀 분석
- 그래프 생성 문법
- difftime
- 총과 카드만들기
- 팀스파르타
- 빅데이터분석
- 데이터분석가
Archives
- Today
- Total
목록2024/09/26 (1)
ch0nny_log
[빅데이터분석] Linux_7.스파크 설치 및 운영
※ 스파크(Spark) 설치스파크(spark) 란 ? hive 의 단점을 개선하기 위해서 나온게 스파크입니다. hive 가 자바를 몰라도 하둡 분산 파일 시스템에 있는 데이터를 SQL로 조회할 수 있게 facebook 에서 만든 noSQL 입니다. hive 의 단점이 disk 에서 데이터를 처리하기 때문에 속도가 너무 느립니다. 스파크는 메모리(memory) 에서 데이터를 처리해서 속도가 아주 빠릅니다. 요즘 하드웨어 성능이 좋아지고 있고 메모리 가격도 예전에 비해서 저렴해져서 스파크(spark) 사용이 대중화가 되고 있습니다. ■ 스파크(spark)의 특징 ? 1. 메모리 기반의 데이터 처리로 속도가 아주 빠릅니다. 2. 하둡의 hdfs 를 이용할 수도 있고 또는 단독으로 사용이 가능합니..
빅데이터 분석(with 아이티윌)/리눅스
2024. 9. 26. 13:18