코드창고

  • 홈
  • 태그
  • 방명록
코드창고

partition 1

Repartiotion 방법

https://code-lib.tistory.com/13 Spark partition 이해하기 스파크에서 분산 병렬처리를 위해서 Partition에 대한 이해는 필수 스파크 작업의 가장작은 단위는 task다 그리고 task는 1개의partition이다 1 task == 1 partition task는 core에 할당되고 이 core들의 집합은 1 code-lib.tistory.com partition이해하기에서 추가적인 설명을 덧붙이고자 한다. 1. spark.default.parallelism VS spark.sql.shuffle.partitions spark.default.parallelism이란? join, reduceByKey 같이 RDD에서 적용되는 파티션을 다룰때 사용된다. 오직 RDD단에만 ..

spark 2024.02.16
이전
1
다음
더보기
프로필사진

코드창고

  • 분류 전체보기 (26)
    • python (7)
    • spark (6)
    • pandas (0)
    • celery (0)
    • ubuntu (1)
    • docker (2)
    • architecture (3)
    • DB (1)
    • CS (2)
    • AI (2)
    • 트랜드 (1)

Tag

off-heap, fastapi, docker, stable diffusion, django, spark, 스타로배우는 코딩, AI, kpop데몬헌터스, on-heap, Clean Architecture, image generate, ubuntu, 개발자탈출, restapi, Python, Linux, deap learning, project-tree, memory,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바