Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- ai assistant
- debug toolbar
- MongoDB
- ubuntu
- git
- pyspark
- django
- coding with ai
- devops
- debug_toolbar
- AI
- tgw
- list
- amazon q
- json
- Amazon
- Python
- Eclipse
- nosql
- SCALA APP
- mcponaws
- django-debug-toolbar
- Transit Gateway
- AWS
- AWSKRUG
- VPC
- Spark
- 툴바안뜸
Archives
- Today
- Total
목록2025/06/01 (1)
STACKBASE
[AWS Bedrock] Multi-Region LLM을 이용하여 Token 허용량 늘리기(1/2)
Multi-Region LLM을 이용하여 Token 허용량 늘리기Multi-Region LLM: AWS는 전 세계 여러 리전(데이터 센터)에 서비스를 제공합니다. Multi-Region LLM은 말 그대로 여러 AWS리전에 LLM 엔드포인트를 배포하는 전략입니다. 이는 다음과 같은 이점을 제공합니다.1) 지연 시간 단축: 사용자와 가까운 리전에서 응답하여 챗봇의 반응 속도를 높입니다.2) 고가용성: 특정 리전에 문제가 생겨도 다른 리전으로 트래픽을 전환하여 서비스 중단 없이 챗봇을 운영할 수 있습니다. 3) 로드 밸런싱: 특정 리전에 부하가 집중될 경우, 다른 리전으로 분산하여 안정적인 서비스를 유지합니다.Python으로 경험하는 Multi-Region LLM 호출 시나리오Multi-Region LLM이..
클라우드/AWS
2025. 6. 1. 23:17