create-entity-app-server 0.0.3
This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
- package/.env.example +68 -0
- package/.gitignore +8 -0
- package/LICENSE +66 -0
- package/README.md +36 -0
- package/bin/create.js +222 -0
- package/configs/cache.json +7 -0
- package/configs/cors.json +24 -0
- package/configs/database.json +30 -0
- package/configs/security.json +45 -0
- package/configs/server.json +31 -0
- package/docs/README.md +274 -0
- package/docs/architecture.md +295 -0
- package/docs/cache.md +217 -0
- package/docs/configs.md +261 -0
- package/docs/database.md +505 -0
- package/docs/design/board-api-design.md +2342 -0
- package/docs/flows.md +581 -0
- package/docs/getting-started.md +83 -0
- package/docs/hooks.md +600 -0
- package/docs/internals.md +60 -0
- package/docs/plugins/2fa.md +121 -0
- package/docs/plugins/alimtalk.md +212 -0
- package/docs/plugins/friendtalk.md +158 -0
- package/docs/plugins/holidays.md +98 -0
- package/docs/plugins/how-to-create.md +148 -0
- package/docs/plugins/identity.md +223 -0
- package/docs/plugins/llm.md +567 -0
- package/docs/plugins/oauth.md +121 -0
- package/docs/plugins/ocr.md +168 -0
- package/docs/plugins/pg.md +226 -0
- package/docs/plugins/push.md +178 -0
- package/docs/plugins/sms.md +228 -0
- package/docs/plugins/taxinvoice.md +197 -0
- package/docs/routes/README.md +247 -0
- package/docs/routes/account-routes.md +262 -0
- package/docs/routes/alimtalk-routes.md +187 -0
- package/docs/routes/board-routes.md +492 -0
- package/docs/routes/email-verification.md +269 -0
- package/docs/routes/friendtalk-routes.md +45 -0
- package/docs/routes/holidays-routes.md +170 -0
- package/docs/routes/how-to-create.md +150 -0
- package/docs/routes/identity-routes.md +310 -0
- package/docs/routes/llm-routes.md +921 -0
- package/docs/routes/ocr-routes.md +133 -0
- package/docs/routes/password-reset.md +234 -0
- package/docs/routes/pg-routes.md +144 -0
- package/docs/routes/push-routes.md +205 -0
- package/docs/routes/sms-routes.md +243 -0
- package/docs/routes/smtp-routes.md +155 -0
- package/docs/routes/tax-invoice-routes.md +109 -0
- package/docs/schedules/dormancy-and-retention.md +160 -0
- package/docs/schedules/how-to-create.md +255 -0
- package/docs/scripts-guide.md +310 -0
- package/docs/security.md +221 -0
- package/docs/system.md +297 -0
- package/package.json +111 -0
- package/scripts/_gen-table-type.ts +605 -0
- package/scripts/build-minify-plugins.mjs +124 -0
- package/scripts/build-obfuscate-system.mjs +38 -0
- package/scripts/build.sh +140 -0
- package/scripts/dist-tsconfig.json +18 -0
- package/scripts/entity.sh +224 -0
- package/scripts/gen-table-type.sh +169 -0
- package/scripts/push.sh +102 -0
- package/scripts/release.sh +51 -0
- package/scripts/reset-all.sh +208 -0
- package/scripts/run.sh +202 -0
- package/src/app/hooks/README.md +148 -0
- package/src/app/hooks/account.ts +26 -0
- package/src/app/hooks/index.ts +19 -0
- package/src/app/hooks/order.ts +230 -0
- package/src/app/hooks/post.ts +162 -0
- package/src/app/plugins/2fa/config.example.json +15 -0
- package/src/app/plugins/2fa/config.json +17 -0
- package/src/app/plugins/2fa/config.ts +44 -0
- package/src/app/plugins/2fa/docs/README.md +139 -0
- package/src/app/plugins/2fa/entities/account.json +30 -0
- package/src/app/plugins/2fa/handlers/disable.ts +114 -0
- package/src/app/plugins/2fa/handlers/index.ts +11 -0
- package/src/app/plugins/2fa/handlers/recovery.ts +98 -0
- package/src/app/plugins/2fa/handlers/regenerate.ts +99 -0
- package/src/app/plugins/2fa/handlers/setup-verify.ts +121 -0
- package/src/app/plugins/2fa/handlers/setup.ts +92 -0
- package/src/app/plugins/2fa/handlers/status.ts +47 -0
- package/src/app/plugins/2fa/handlers/utils.ts +222 -0
- package/src/app/plugins/2fa/handlers/verify.ts +92 -0
- package/src/app/plugins/2fa/index.ts +50 -0
- package/src/app/plugins/2fa/routes.ts +49 -0
- package/src/app/plugins/2fa/templates/auth/2fa_disabled.html +23 -0
- package/src/app/plugins/2fa/templates/auth/2fa_recovery_regenerated.html +31 -0
- package/src/app/plugins/2fa/templates/auth/2fa_setup_complete.html +43 -0
- package/src/app/plugins/2fa/totp-utils.ts +189 -0
- package/src/app/plugins/2fa/types.ts +95 -0
- package/src/app/plugins/README.md +118 -0
- package/src/app/plugins/ais/config.json +7 -0
- package/src/app/plugins/ais/config.ts +32 -0
- package/src/app/plugins/ais/docs/README.md +142 -0
- package/src/app/plugins/ais/docs/api.md +138 -0
- package/src/app/plugins/ais/entities/ais_vessel.json +64 -0
- package/src/app/plugins/ais/handlers.ts +88 -0
- package/src/app/plugins/ais/index.ts +21 -0
- package/src/app/plugins/ais/routes.ts +13 -0
- package/src/app/plugins/ais/service.ts +242 -0
- package/src/app/plugins/ais/types/index.ts +78 -0
- package/src/app/plugins/alimtalk/config.example.json +52 -0
- package/src/app/plugins/alimtalk/config.json +26 -0
- package/src/app/plugins/alimtalk/config.ts +75 -0
- package/src/app/plugins/alimtalk/docs/README.md +140 -0
- package/src/app/plugins/alimtalk/entities/alimtalk_log.json +65 -0
- package/src/app/plugins/alimtalk/entities/alimtalk_msg.json +53 -0
- package/src/app/plugins/alimtalk/entity-adapter.ts +196 -0
- package/src/app/plugins/alimtalk/handlers.ts +84 -0
- package/src/app/plugins/alimtalk/index.ts +80 -0
- package/src/app/plugins/alimtalk/providers/aligo.ts +151 -0
- package/src/app/plugins/alimtalk/providers/index.ts +29 -0
- package/src/app/plugins/alimtalk/providers/nhn.ts +254 -0
- package/src/app/plugins/alimtalk/providers/ppurio.ts +145 -0
- package/src/app/plugins/alimtalk/providers/solapi.ts +145 -0
- package/src/app/plugins/alimtalk/routes.ts +15 -0
- package/src/app/plugins/alimtalk/service.ts +423 -0
- package/src/app/plugins/alimtalk/template-cache.ts +42 -0
- package/src/app/plugins/alimtalk/templates/alimtalk.json +27 -0
- package/src/app/plugins/alimtalk/types/client.ts +48 -0
- package/src/app/plugins/alimtalk/types/config.ts +53 -0
- package/src/app/plugins/alimtalk/types/friendtalk.ts +90 -0
- package/src/app/plugins/alimtalk/types/index.ts +4 -0
- package/src/app/plugins/alimtalk/types/job.ts +56 -0
- package/src/app/plugins/alimtalk/webhook.ts +211 -0
- package/src/app/plugins/distance-server/config.json +6 -0
- package/src/app/plugins/distance-server/config.ts +50 -0
- package/src/app/plugins/distance-server/docs/README.md +114 -0
- package/src/app/plugins/distance-server/handlers.ts +104 -0
- package/src/app/plugins/distance-server/index.ts +23 -0
- package/src/app/plugins/distance-server/routes.ts +36 -0
- package/src/app/plugins/distance-server/service.ts +187 -0
- package/src/app/plugins/distance-server/types/index.ts +8 -0
- package/src/app/plugins/example/config.json +6 -0
- package/src/app/plugins/example/config.ts +46 -0
- package/src/app/plugins/example/docs/README.md +64 -0
- package/src/app/plugins/example/entity-adapter.ts +96 -0
- package/src/app/plugins/example/handlers.ts +94 -0
- package/src/app/plugins/example/index.ts +63 -0
- package/src/app/plugins/example/routes.ts +30 -0
- package/src/app/plugins/example/service.ts +31 -0
- package/src/app/plugins/example/types/config.ts +11 -0
- package/src/app/plugins/example/types/index.ts +1 -0
- package/src/app/plugins/friendtalk/config.example.json +35 -0
- package/src/app/plugins/friendtalk/config.json +11 -0
- package/src/app/plugins/friendtalk/config.ts +70 -0
- package/src/app/plugins/friendtalk/docs/README.md +110 -0
- package/src/app/plugins/friendtalk/entities/friendtalk_log.json +89 -0
- package/src/app/plugins/friendtalk/entities/friendtalk_msg.json +91 -0
- package/src/app/plugins/friendtalk/entity-adapter.ts +150 -0
- package/src/app/plugins/friendtalk/handlers.ts +56 -0
- package/src/app/plugins/friendtalk/routes.ts +12 -0
- package/src/app/plugins/friendtalk/templates/friendtalk.json +16 -0
- package/src/app/plugins/holidays/config.example.json +6 -0
- package/src/app/plugins/holidays/config.json +10 -0
- package/src/app/plugins/holidays/config.ts +44 -0
- package/src/app/plugins/holidays/docs/README.md +122 -0
- package/src/app/plugins/holidays/entities/holiday.json +22 -0
- package/src/app/plugins/holidays/handlers.ts +135 -0
- package/src/app/plugins/holidays/index.ts +78 -0
- package/src/app/plugins/holidays/routes.ts +18 -0
- package/src/app/plugins/holidays/service.ts +241 -0
- package/src/app/plugins/holidays/types/api.ts +49 -0
- package/src/app/plugins/holidays/types/config.ts +8 -0
- package/src/app/plugins/holidays/types/index.ts +2 -0
- package/src/app/plugins/identity/config.example.json +43 -0
- package/src/app/plugins/identity/config.json +30 -0
- package/src/app/plugins/identity/config.ts +138 -0
- package/src/app/plugins/identity/crypto.ts +51 -0
- package/src/app/plugins/identity/docs/README.md +164 -0
- package/src/app/plugins/identity/entities/account.json +27 -0
- package/src/app/plugins/identity/entities/identity_verification.json +113 -0
- package/src/app/plugins/identity/entity-adapter.ts +242 -0
- package/src/app/plugins/identity/handlers.ts +239 -0
- package/src/app/plugins/identity/index.ts +80 -0
- package/src/app/plugins/identity/providers/danal.ts +150 -0
- package/src/app/plugins/identity/providers/index.ts +38 -0
- package/src/app/plugins/identity/providers/kmc.ts +140 -0
- package/src/app/plugins/identity/providers/nice.ts +304 -0
- package/src/app/plugins/identity/routes.ts +22 -0
- package/src/app/plugins/identity/service.ts +361 -0
- package/src/app/plugins/identity/types/config.ts +35 -0
- package/src/app/plugins/identity/types/index.ts +2 -0
- package/src/app/plugins/identity/types/verification.ts +105 -0
- package/src/app/plugins/kobc_freight/config.json +6 -0
- package/src/app/plugins/kobc_freight/config.ts +28 -0
- package/src/app/plugins/kobc_freight/docs/README.md +316 -0
- package/src/app/plugins/kobc_freight/entities/kobc_freight_entry.json +31 -0
- package/src/app/plugins/kobc_freight/entities/kobc_kcci_entry.json +67 -0
- package/src/app/plugins/kobc_freight/entities/kobc_kpli_entry.json +27 -0
- package/src/app/plugins/kobc_freight/entities/kobc_ncfi_entry.json +99 -0
- package/src/app/plugins/kobc_freight/handlers.ts +283 -0
- package/src/app/plugins/kobc_freight/index.ts +21 -0
- package/src/app/plugins/kobc_freight/routes.ts +39 -0
- package/src/app/plugins/kobc_freight/service.ts +604 -0
- package/src/app/plugins/kobc_freight/types/index.ts +99 -0
- package/src/app/plugins/llm/cache.ts +138 -0
- package/src/app/plugins/llm/chatbot-store.ts +270 -0
- package/src/app/plugins/llm/chunker.ts +96 -0
- package/src/app/plugins/llm/config.example.json +260 -0
- package/src/app/plugins/llm/config.json +71 -0
- package/src/app/plugins/llm/config.ts +99 -0
- package/src/app/plugins/llm/conversation-store.ts +140 -0
- package/src/app/plugins/llm/docs/README.md +120 -0
- package/src/app/plugins/llm/docs/api.md +250 -0
- package/src/app/plugins/llm/document-store.ts +318 -0
- package/src/app/plugins/llm/entities/llm_chatbot.json +66 -0
- package/src/app/plugins/llm/entities/llm_conversation.json +61 -0
- package/src/app/plugins/llm/entities/llm_document.json +67 -0
- package/src/app/plugins/llm/entities/llm_usage.json +51 -0
- package/src/app/plugins/llm/entities/llm_user_profile.json +45 -0
- package/src/app/plugins/llm/handlers.ts +1114 -0
- package/src/app/plugins/llm/index.ts +90 -0
- package/src/app/plugins/llm/profile-store.ts +125 -0
- package/src/app/plugins/llm/providers/anthropic.ts +233 -0
- package/src/app/plugins/llm/providers/azure.ts +267 -0
- package/src/app/plugins/llm/providers/gemini.ts +252 -0
- package/src/app/plugins/llm/providers/index.ts +86 -0
- package/src/app/plugins/llm/providers/ollama.ts +237 -0
- package/src/app/plugins/llm/providers/openai.ts +244 -0
- package/src/app/plugins/llm/routes.ts +73 -0
- package/src/app/plugins/llm/service.ts +965 -0
- package/src/app/plugins/llm/template-loader.ts +135 -0
- package/src/app/plugins/llm/templates/prompts/extract_json.json +8 -0
- package/src/app/plugins/llm/templates/prompts/summarize.json +10 -0
- package/src/app/plugins/llm/templates/prompts/translate.json +10 -0
- package/src/app/plugins/llm/types/chat.ts +96 -0
- package/src/app/plugins/llm/types/chatbot.ts +143 -0
- package/src/app/plugins/llm/types/config.ts +47 -0
- package/src/app/plugins/llm/types/conversation.ts +116 -0
- package/src/app/plugins/llm/types/index.ts +7 -0
- package/src/app/plugins/llm/types/profile.ts +48 -0
- package/src/app/plugins/llm/types/store.ts +50 -0
- package/src/app/plugins/llm/types/usage.ts +27 -0
- package/src/app/plugins/llm/usage-store.ts +64 -0
- package/src/app/plugins/oauth/account/handlers/index.ts +4 -0
- package/src/app/plugins/oauth/account/handlers/link.ts +165 -0
- package/src/app/plugins/oauth/account/handlers/providers-list.ts +49 -0
- package/src/app/plugins/oauth/account/handlers/refresh.ts +92 -0
- package/src/app/plugins/oauth/account/handlers/unlink.ts +105 -0
- package/src/app/plugins/oauth/config.example.json +65 -0
- package/src/app/plugins/oauth/config.json +72 -0
- package/src/app/plugins/oauth/config.ts +182 -0
- package/src/app/plugins/oauth/docs/README.md +160 -0
- package/src/app/plugins/oauth/entities/account_oauth.json +74 -0
- package/src/app/plugins/oauth/handlers/callback.ts +314 -0
- package/src/app/plugins/oauth/handlers/index.ts +2 -0
- package/src/app/plugins/oauth/handlers/redirect.ts +47 -0
- package/src/app/plugins/oauth/index.ts +74 -0
- package/src/app/plugins/oauth/providers/index.ts +530 -0
- package/src/app/plugins/oauth/routes.ts +49 -0
- package/src/app/plugins/oauth/service.ts +14 -0
- package/src/app/plugins/oauth/state.ts +105 -0
- package/src/app/plugins/oauth/types/index.ts +52 -0
- package/src/app/plugins/oauth/upsert.ts +162 -0
- package/src/app/plugins/ocr/cache.ts +50 -0
- package/src/app/plugins/ocr/config.example.json +103 -0
- package/src/app/plugins/ocr/config.json +110 -0
- package/src/app/plugins/ocr/config.ts +126 -0
- package/src/app/plugins/ocr/direction.ts +48 -0
- package/src/app/plugins/ocr/dispatch.ts +130 -0
- package/src/app/plugins/ocr/docs/README.md +125 -0
- package/src/app/plugins/ocr/docs/api.md +159 -0
- package/src/app/plugins/ocr/entities/ocr_result.json +98 -0
- package/src/app/plugins/ocr/entities/ocr_usage.json +57 -0
- package/src/app/plugins/ocr/entity-adapter.ts +198 -0
- package/src/app/plugins/ocr/errors.ts +42 -0
- package/src/app/plugins/ocr/handlers.ts +250 -0
- package/src/app/plugins/ocr/index.ts +68 -0
- package/src/app/plugins/ocr/llm-parser.ts +164 -0
- package/src/app/plugins/ocr/parsing-pipeline.ts +87 -0
- package/src/app/plugins/ocr/pdf-converter.ts +136 -0
- package/src/app/plugins/ocr/preprocessor.ts +313 -0
- package/src/app/plugins/ocr/providers/aws.ts +200 -0
- package/src/app/plugins/ocr/providers/azure.ts +183 -0
- package/src/app/plugins/ocr/providers/google.ts +155 -0
- package/src/app/plugins/ocr/providers/index.ts +80 -0
- package/src/app/plugins/ocr/providers/naver.ts +186 -0
- package/src/app/plugins/ocr/providers/tesseract.ts +198 -0
- package/src/app/plugins/ocr/providers/upstage.ts +156 -0
- package/src/app/plugins/ocr/quota.ts +108 -0
- package/src/app/plugins/ocr/refiner.ts +112 -0
- package/src/app/plugins/ocr/routes.ts +19 -0
- package/src/app/plugins/ocr/service.ts +333 -0
- package/src/app/plugins/ocr/template-loader.ts +72 -0
- package/src/app/plugins/ocr/template-matcher.ts +422 -0
- package/src/app/plugins/ocr/templates/business_reg.json +145 -0
- package/src/app/plugins/ocr/templates/career_cert.json +93 -0
- package/src/app/plugins/ocr/templates/driver_license.json +89 -0
- package/src/app/plugins/ocr/templates/facility_card.json +82 -0
- package/src/app/plugins/ocr/templates/id_card.json +55 -0
- package/src/app/plugins/ocr/templates/invoice.json +92 -0
- package/src/app/plugins/ocr/templates/namecard.json +116 -0
- package/src/app/plugins/ocr/templates/prompts/business_reg.json +14 -0
- package/src/app/plugins/ocr/templates/prompts/career_cert.json +16 -0
- package/src/app/plugins/ocr/templates/prompts/driver_license.json +14 -0
- package/src/app/plugins/ocr/templates/prompts/facility_card.json +15 -0
- package/src/app/plugins/ocr/templates/prompts/general.json +13 -0
- package/src/app/plugins/ocr/templates/prompts/id_card.json +11 -0
- package/src/app/plugins/ocr/templates/prompts/invoice.json +17 -0
- package/src/app/plugins/ocr/templates/prompts/namecard.json +15 -0
- package/src/app/plugins/ocr/templates/prompts/receipt.json +14 -0
- package/src/app/plugins/ocr/templates/receipt.json +79 -0
- package/src/app/plugins/ocr/types/config.ts +60 -0
- package/src/app/plugins/ocr/types/driver.ts +71 -0
- package/src/app/plugins/ocr/types/index.ts +5 -0
- package/src/app/plugins/ocr/types/parsed.ts +101 -0
- package/src/app/plugins/ocr/types/store.ts +70 -0
- package/src/app/plugins/ocr/types/template.ts +89 -0
- package/src/app/plugins/ocr/utils.ts +18 -0
- package/src/app/plugins/pg/config.example.json +79 -0
- package/src/app/plugins/pg/config.json +35 -0
- package/src/app/plugins/pg/config.ts +58 -0
- package/src/app/plugins/pg/docs/README.md +176 -0
- package/src/app/plugins/pg/entities/pg_cancel.json +60 -0
- package/src/app/plugins/pg/entities/pg_order.json +115 -0
- package/src/app/plugins/pg/entities/pg_webhook_log.json +52 -0
- package/src/app/plugins/pg/entity-adapter.ts +144 -0
- package/src/app/plugins/pg/handlers.ts +240 -0
- package/src/app/plugins/pg/index.ts +98 -0
- package/src/app/plugins/pg/providers/danal.ts +178 -0
- package/src/app/plugins/pg/providers/hecto.ts +340 -0
- package/src/app/plugins/pg/providers/index.ts +53 -0
- package/src/app/plugins/pg/providers/inicis.ts +151 -0
- package/src/app/plugins/pg/providers/kakaopay.ts +242 -0
- package/src/app/plugins/pg/providers/kcp.ts +147 -0
- package/src/app/plugins/pg/providers/naverpay.ts +299 -0
- package/src/app/plugins/pg/providers/payco.ts +290 -0
- package/src/app/plugins/pg/providers/payletter.ts +377 -0
- package/src/app/plugins/pg/providers/paypal.ts +423 -0
- package/src/app/plugins/pg/providers/toss.ts +157 -0
- package/src/app/plugins/pg/providers/wanna.ts +163 -0
- package/src/app/plugins/pg/routes.ts +31 -0
- package/src/app/plugins/pg/service.ts +531 -0
- package/src/app/plugins/pg/types/client.ts +52 -0
- package/src/app/plugins/pg/types/config.ts +42 -0
- package/src/app/plugins/pg/types/error.ts +25 -0
- package/src/app/plugins/pg/types/index.ts +4 -0
- package/src/app/plugins/pg/types/payment.ts +145 -0
- package/src/app/plugins/providers/docs/README.md +32 -0
- package/src/app/plugins/providers/solapi-auth.ts +27 -0
- package/src/app/plugins/push/config.example.json +26 -0
- package/src/app/plugins/push/config.json +18 -0
- package/src/app/plugins/push/config.ts +119 -0
- package/src/app/plugins/push/docs/README.md +147 -0
- package/src/app/plugins/push/entities/push_log.json +86 -0
- package/src/app/plugins/push/entities/push_msg.json +56 -0
- package/src/app/plugins/push/entity-adapter.ts +326 -0
- package/src/app/plugins/push/handlers.ts +193 -0
- package/src/app/plugins/push/index.ts +85 -0
- package/src/app/plugins/push/providers/apns.ts +152 -0
- package/src/app/plugins/push/providers/fcm.ts +181 -0
- package/src/app/plugins/push/providers/index.ts +42 -0
- package/src/app/plugins/push/providers/utils.ts +30 -0
- package/src/app/plugins/push/routes.ts +24 -0
- package/src/app/plugins/push/service.ts +297 -0
- package/src/app/plugins/push/types/config.ts +32 -0
- package/src/app/plugins/push/types/index.ts +14 -0
- package/src/app/plugins/push/types/job.ts +79 -0
- package/src/app/plugins/shared/docs/README.md +11 -0
- package/src/app/plugins/sms/config.example.json +30 -0
- package/src/app/plugins/sms/config.json +33 -0
- package/src/app/plugins/sms/config.ts +158 -0
- package/src/app/plugins/sms/docs/README.md +236 -0
- package/src/app/plugins/sms/entities/sms_log.json +65 -0
- package/src/app/plugins/sms/entities/sms_msg.json +82 -0
- package/src/app/plugins/sms/entities/sms_verification.json +50 -0
- package/src/app/plugins/sms/entity-adapter.ts +213 -0
- package/src/app/plugins/sms/handlers.ts +149 -0
- package/src/app/plugins/sms/index.ts +93 -0
- package/src/app/plugins/sms/providers/aligo.ts +73 -0
- package/src/app/plugins/sms/providers/aws-sns.ts +182 -0
- package/src/app/plugins/sms/providers/index.ts +47 -0
- package/src/app/plugins/sms/providers/nhn.ts +82 -0
- package/src/app/plugins/sms/providers/ppurio.ts +76 -0
- package/src/app/plugins/sms/providers/solapi.ts +83 -0
- package/src/app/plugins/sms/routes.ts +23 -0
- package/src/app/plugins/sms/service.ts +239 -0
- package/src/app/plugins/sms/types/client.ts +41 -0
- package/src/app/plugins/sms/types/config.ts +46 -0
- package/src/app/plugins/sms/types/index.ts +3 -0
- package/src/app/plugins/sms/types/job.ts +51 -0
- package/src/app/plugins/sms/verification.ts +162 -0
- package/src/app/plugins/smtp/config.json +5 -0
- package/src/app/plugins/smtp/config.ts +41 -0
- package/src/app/plugins/smtp/docs/README.md +165 -0
- package/src/app/plugins/smtp/handlers.ts +52 -0
- package/src/app/plugins/smtp/index.ts +33 -0
- package/src/app/plugins/smtp/routes.ts +19 -0
- package/src/app/plugins/smtp/templates/layout.html +50 -0
- package/src/app/plugins/smtp/types/config.ts +8 -0
- package/src/app/plugins/smtp/types/index.ts +1 -0
- package/src/app/plugins/taxinvoice/config.example.json +60 -0
- package/src/app/plugins/taxinvoice/config.json +35 -0
- package/src/app/plugins/taxinvoice/config.ts +117 -0
- package/src/app/plugins/taxinvoice/docs/README.md +322 -0
- package/src/app/plugins/taxinvoice/entities/tax_invoice.json +229 -0
- package/src/app/plugins/taxinvoice/entities/tax_invoice_item.json +56 -0
- package/src/app/plugins/taxinvoice/entities/tax_invoice_log.json +50 -0
- package/src/app/plugins/taxinvoice/entities/tax_invoice_party.json +61 -0
- package/src/app/plugins/taxinvoice/entity-adapter.ts +285 -0
- package/src/app/plugins/taxinvoice/handlers.ts +120 -0
- package/src/app/plugins/taxinvoice/index.ts +74 -0
- package/src/app/plugins/taxinvoice/providers/barobill.ts +273 -0
- package/src/app/plugins/taxinvoice/providers/bolta.ts +193 -0
- package/src/app/plugins/taxinvoice/providers/esero.ts +201 -0
- package/src/app/plugins/taxinvoice/providers/index.ts +41 -0
- package/src/app/plugins/taxinvoice/providers/popbill.ts +258 -0
- package/src/app/plugins/taxinvoice/providers/sendbill.ts +443 -0
- package/src/app/plugins/taxinvoice/providers/smartbill.ts +234 -0
- package/src/app/plugins/taxinvoice/routes.ts +17 -0
- package/src/app/plugins/taxinvoice/service.ts +439 -0
- package/src/app/plugins/taxinvoice/types/client.ts +57 -0
- package/src/app/plugins/taxinvoice/types/config.ts +42 -0
- package/src/app/plugins/taxinvoice/types/index.ts +4 -0
- package/src/app/plugins/taxinvoice/types/invoice.ts +128 -0
- package/src/app/plugins/taxinvoice/types/queue.ts +22 -0
- package/src/app/plugins/vessel_kr/config.json +9 -0
- package/src/app/plugins/vessel_kr/config.ts +32 -0
- package/src/app/plugins/vessel_kr/docs/README.md +167 -0
- package/src/app/plugins/vessel_kr/entities/vessel_kr_entry.json +136 -0
- package/src/app/plugins/vessel_kr/handlers.ts +102 -0
- package/src/app/plugins/vessel_kr/index.ts +21 -0
- package/src/app/plugins/vessel_kr/routes.ts +15 -0
- package/src/app/plugins/vessel_kr/service.ts +264 -0
- package/src/app/plugins/vessel_kr/types/index.ts +100 -0
- package/src/app/routes/README.md +71 -0
- package/src/app/routes/account/change-password/config.json +5 -0
- package/src/app/routes/account/change-password/entities/password_history.json +18 -0
- package/src/app/routes/account/change-password/handlers.ts +204 -0
- package/src/app/routes/account/change-password/routes.ts +28 -0
- package/src/app/routes/account/config.json +5 -0
- package/src/app/routes/account/reactivate/config.json +5 -0
- package/src/app/routes/account/reactivate/handlers.ts +249 -0
- package/src/app/routes/account/reactivate/routes.ts +14 -0
- package/src/app/routes/account/register/config-loader.ts +34 -0
- package/src/app/routes/account/register/config.json +8 -0
- package/src/app/routes/account/register/handlers.ts +207 -0
- package/src/app/routes/account/register/routes.ts +25 -0
- package/src/app/routes/account/register/types/index.ts +50 -0
- package/src/app/routes/account/routes.ts +31 -0
- package/src/app/routes/account/templates/force_reset.html +18 -0
- package/src/app/routes/account/templates/welcome.html +14 -0
- package/src/app/routes/account/withdraw/handlers.ts +111 -0
- package/src/app/routes/account/withdraw/routes.ts +18 -0
- package/src/app/routes/approval/config.json +5 -0
- package/src/app/routes/approval/entities/approval.json +99 -0
- package/src/app/routes/approval/entities/comments.json +17 -0
- package/src/app/routes/approval/entities/reference.json +16 -0
- package/src/app/routes/approval/routes.ts +30 -0
- package/src/app/routes/auth/config.json +5 -0
- package/src/app/routes/auth/handlers.ts +245 -0
- package/src/app/routes/auth/routes.ts +16 -0
- package/src/app/routes/board/config.json +5 -0
- package/src/app/routes/board/entities/board_category.json +90 -0
- package/src/app/routes/board/entities/board_comment.json +83 -0
- package/src/app/routes/board/entities/board_like.json +51 -0
- package/src/app/routes/board/entities/board_mention.json +50 -0
- package/src/app/routes/board/entities/board_post.json +148 -0
- package/src/app/routes/board/entities/board_post_tag.json +41 -0
- package/src/app/routes/board/entities/board_rating.json +127 -0
- package/src/app/routes/board/entities/board_read_log.json +29 -0
- package/src/app/routes/board/entities/board_report.json +53 -0
- package/src/app/routes/board/entities/board_tag.json +21 -0
- package/src/app/routes/board/handlers/categories.ts +134 -0
- package/src/app/routes/board/handlers/comments.ts +207 -0
- package/src/app/routes/board/handlers/files.ts +104 -0
- package/src/app/routes/board/handlers/likes.ts +31 -0
- package/src/app/routes/board/handlers/mentions.ts +54 -0
- package/src/app/routes/board/handlers/posts.ts +577 -0
- package/src/app/routes/board/handlers/ratings.ts +60 -0
- package/src/app/routes/board/handlers/reports.ts +131 -0
- package/src/app/routes/board/handlers/tags.ts +81 -0
- package/src/app/routes/board/routes.ts +137 -0
- package/src/app/routes/calendar/config.json +5 -0
- package/src/app/routes/calendar/entities/calendar_attendees.json +23 -0
- package/src/app/routes/calendar/entities/calendar_comments.json +17 -0
- package/src/app/routes/calendar/entities/calendar_events.json +48 -0
- package/src/app/routes/calendar/entities/calendar_kind.json +11 -0
- package/src/app/routes/calendar/entities/calendar_method.json +11 -0
- package/src/app/routes/calendar/routes.ts +32 -0
- package/src/app/routes/email-verify/config-loader.ts +47 -0
- package/src/app/routes/email-verify/config.example.json +13 -0
- package/src/app/routes/email-verify/config.json +16 -0
- package/src/app/routes/email-verify/entities/account.json +23 -0
- package/src/app/routes/email-verify/handlers/activate.ts +103 -0
- package/src/app/routes/email-verify/handlers/change.ts +106 -0
- package/src/app/routes/email-verify/handlers/confirm.ts +87 -0
- package/src/app/routes/email-verify/handlers/index.ts +20 -0
- package/src/app/routes/email-verify/handlers/send.ts +157 -0
- package/src/app/routes/email-verify/handlers/status.ts +53 -0
- package/src/app/routes/email-verify/handlers/utils.ts +85 -0
- package/src/app/routes/email-verify/routes.ts +54 -0
- package/src/app/routes/email-verify/templates/verification.html +15 -0
- package/src/app/routes/email-verify/templates/verification_link.html +19 -0
- package/src/app/routes/email-verify/types/index.ts +77 -0
- package/src/app/routes/email-verify/verification-utils.ts +57 -0
- package/src/app/routes/example-db/config.json +5 -0
- package/src/app/routes/example-db/handlers.ts +220 -0
- package/src/app/routes/example-db/models/account-ext.ts +33 -0
- package/src/app/routes/example-db/models/users.ts +30 -0
- package/src/app/routes/example-db/routes.ts +23 -0
- package/src/app/routes/example-db/types/defaults.ts +21 -0
- package/src/app/routes/example-db/types/index.ts +4 -0
- package/src/app/routes/example-db/types/params.ts +3 -0
- package/src/app/routes/example-db/types/query.ts +6 -0
- package/src/app/routes/example-db/types/user.ts +11 -0
- package/src/app/routes/example-es/config.json +5 -0
- package/src/app/routes/example-es/handlers.ts +216 -0
- package/src/app/routes/example-es/routes.ts +24 -0
- package/src/app/routes/example-es/types/defaults.ts +30 -0
- package/src/app/routes/example-es/types/index.ts +4 -0
- package/src/app/routes/example-es/types/params.ts +3 -0
- package/src/app/routes/example-es/types/post.ts +12 -0
- package/src/app/routes/example-es/types/query.ts +14 -0
- package/src/app/routes/funeral/config.json +5 -0
- package/src/app/routes/funeral/entities/funeral.json +77 -0
- package/src/app/routes/funeral/entities/funeral_docs.json +36 -0
- package/src/app/routes/funeral/entities/funeral_mourner.json +31 -0
- package/src/app/routes/funeral/entities/funeral_order.json +48 -0
- package/src/app/routes/funeral/entities/funeral_room.json +61 -0
- package/src/app/routes/funeral/entities/funeral_schedule.json +39 -0
- package/src/app/routes/funeral/routes.ts +32 -0
- package/src/app/routes/health/config.json +5 -0
- package/src/app/routes/health/handlers.ts +69 -0
- package/src/app/routes/health/routes.ts +14 -0
- package/src/app/routes/hr/career/config.json +5 -0
- package/src/app/routes/hr/career/entities/employee_career.json +15 -0
- package/src/app/routes/hr/career/routes.ts +25 -0
- package/src/app/routes/hr/config.json +5 -0
- package/src/app/routes/hr/education/config.json +5 -0
- package/src/app/routes/hr/education/entities/employee_education.json +29 -0
- package/src/app/routes/hr/education/entities/employee_education_mans.json +25 -0
- package/src/app/routes/hr/education/entities/employee_school.json +19 -0
- package/src/app/routes/hr/education/routes.ts +28 -0
- package/src/app/routes/hr/employee/config.json +5 -0
- package/src/app/routes/hr/employee/entities/employee.json +59 -0
- package/src/app/routes/hr/employee/entities/employee_cert.json +19 -0
- package/src/app/routes/hr/employee/entities/employee_reward.json +21 -0
- package/src/app/routes/hr/employee/routes.ts +27 -0
- package/src/app/routes/hr/entities/hr_group.json +47 -0
- package/src/app/routes/hr/entities/hr_group_pv.json +20 -0
- package/src/app/routes/hr/entities/hr_role.json +43 -0
- package/src/app/routes/hr/entities/hr_role_pv.json +20 -0
- package/src/app/routes/hr/routes.ts +29 -0
- package/src/app/routes/messages/chat/config.json +5 -0
- package/src/app/routes/messages/chat/entities/user_chat.json +47 -0
- package/src/app/routes/messages/chat/entities/user_chat_room.json +38 -0
- package/src/app/routes/messages/chat/entities/user_chat_room_member.json +49 -0
- package/src/app/routes/messages/chat/routes.ts +28 -0
- package/src/app/routes/messages/msgbox/config.json +5 -0
- package/src/app/routes/messages/msgbox/entities/user_msgbox.json +73 -0
- package/src/app/routes/messages/msgbox/routes.ts +28 -0
- package/src/app/routes/password-reset/config.example.json +13 -0
- package/src/app/routes/password-reset/config.json +15 -0
- package/src/app/routes/password-reset/entities/account.json +13 -0
- package/src/app/routes/password-reset/handlers.ts +335 -0
- package/src/app/routes/password-reset/password-utils.ts +96 -0
- package/src/app/routes/password-reset/routes.ts +84 -0
- package/src/app/routes/password-reset/templates/password_reset.html +21 -0
- package/src/app/routes/password-reset/templates/password_reset_link.html +19 -0
- package/src/app/routes/password-reset/types/index.ts +95 -0
- package/src/app/routes/privilege/config.json +5 -0
- package/src/app/routes/privilege/entities/pv_group.json +29 -0
- package/src/app/routes/privilege/entities/pv_group_item.json +31 -0
- package/src/app/routes/privilege/entities/pv_item.json +176 -0
- package/src/app/routes/privilege/entities/user_pv_group.json +20 -0
- package/src/app/routes/privilege/entities/user_pv_item.json +20 -0
- package/src/app/routes/privilege/routes.ts +33 -0
- package/src/app/routes/user/config.json +5 -0
- package/src/app/routes/user/entities/user.json +64 -0
- package/src/app/routes/user/entities/user_biometric.json +28 -0
- package/src/app/routes/user/routes.ts +27 -0
- package/src/app/routes/vessel-tracking/config.json +3 -0
- package/src/app/routes/vessel-tracking/entities/tracked_vessel.json +261 -0
- package/src/app/routes/vessel-tracking/handlers.ts +134 -0
- package/src/app/routes/vessel-tracking/routes.ts +25 -0
- package/src/app/routes/vessel-tracking/types/index.ts +5 -0
- package/src/app/routes/vessel-tracking/types/vessel.ts +59 -0
- package/src/app/schedules/README.md +105 -0
- package/src/app/schedules/ais_sync/config.json +4 -0
- package/src/app/schedules/ais_sync/index.ts +69 -0
- package/src/app/schedules/data-retention/config.json +9 -0
- package/src/app/schedules/data-retention/index.ts +238 -0
- package/src/app/schedules/dormancy/config.json +15 -0
- package/src/app/schedules/dormancy/entities/account.json +14 -0
- package/src/app/schedules/dormancy/entities/privacy_cron_lock.json +23 -0
- package/src/app/schedules/dormancy/index.ts +289 -0
- package/src/app/schedules/dormancy/templates/dormancy_completed.html +21 -0
- package/src/app/schedules/dormancy/templates/dormancy_warning.html +20 -0
- package/src/app/schedules/kobc_freight_sync/config.json +4 -0
- package/src/app/schedules/kobc_freight_sync/index.ts +94 -0
- package/src/app/schedules/vessel_kr_sync/config.json +4 -0
- package/src/app/schedules/vessel_kr_sync/index.ts +72 -0
- package/src/system/app.ts +129 -0
- package/src/system/cache/_store-ref.ts +15 -0
- package/src/system/cache/config.ts +61 -0
- package/src/system/cache/drivers/memcached.ts +135 -0
- package/src/system/cache/drivers/memory.ts +92 -0
- package/src/system/cache/drivers/redis.ts +109 -0
- package/src/system/cache/index.ts +43 -0
- package/src/system/cache/namespaced.ts +79 -0
- package/src/system/cache/plugin.ts +59 -0
- package/src/system/cache/types.ts +81 -0
- package/src/system/config/config-path.ts +20 -0
- package/src/system/config/cors.ts +49 -0
- package/src/system/config/database.ts +190 -0
- package/src/system/config/entity-server.ts +8 -0
- package/src/system/config/env-substitution.ts +4 -0
- package/src/system/config/env.ts +30 -0
- package/src/system/config/json-config.ts +13 -0
- package/src/system/config/module-path.ts +16 -0
- package/src/system/config/packet-encrypt.ts +80 -0
- package/src/system/config/rate-limit.ts +4 -0
- package/src/system/config/security-loader.ts +25 -0
- package/src/system/config/security.ts +16 -0
- package/src/system/config/server.ts +81 -0
- package/src/system/crypto/cipher.ts +117 -0
- package/src/system/crypto/data-encrypt.ts +174 -0
- package/src/system/crypto/hash.ts +24 -0
- package/src/system/crypto/packet.test.ts +23 -0
- package/src/system/crypto/packet.ts +97 -0
- package/src/system/crypto/random.ts +19 -0
- package/src/system/email/sender.ts +85 -0
- package/src/system/email/template-engine.ts +147 -0
- package/src/system/entity-server/bootstrap.ts +270 -0
- package/src/system/entity-server/client.ts +64 -0
- package/src/system/hooks/loader.ts +32 -0
- package/src/system/hooks/runner.ts +159 -0
- package/src/system/hooks/types.ts +75 -0
- package/src/system/hooks/withdraw-hooks.ts +42 -0
- package/src/system/http/cookie.ts +62 -0
- package/src/system/http/response.ts +16 -0
- package/src/system/index.ts +48 -0
- package/src/system/logging/log-format.ts +50 -0
- package/src/system/logging/logger.ts +104 -0
- package/src/system/middleware/_db-ref.ts +26 -0
- package/src/system/middleware/_push-ref.ts +28 -0
- package/src/system/middleware/access-log.ts +34 -0
- package/src/system/middleware/auth.ts +67 -0
- package/src/system/middleware/csrf.ts +172 -0
- package/src/system/middleware/database.ts +44 -0
- package/src/system/middleware/error-handler.ts +51 -0
- package/src/system/middleware/extension-loader.ts +111 -0
- package/src/system/middleware/packet-encrypt.ts +281 -0
- package/src/system/middleware/request-id.ts +18 -0
- package/src/system/plugins/access-log.ts +34 -0
- package/src/system/plugins/packet-encrypt.ts +281 -0
- package/src/system/proxy/register.ts +37 -0
- package/src/system/public-api.ts +140 -0
- package/src/system/push/sender.ts +131 -0
- package/src/system/routes/entity-interceptor.ts +327 -0
- package/src/system/routes/loader.ts +215 -0
- package/src/system/scheduler/cron-utils.ts +150 -0
- package/src/system/scheduler/distributed-lock.ts +141 -0
- package/src/system/scheduler/schedule-loader.ts +105 -0
- package/src/system/security/anonymous-device-id.ts +41 -0
- package/src/system/security/anonymous-device.ts +98 -0
- package/src/system/security/anonymous-packet-token.ts +23 -0
- package/src/system/security/packet-bootstrap.ts +16 -0
- package/src/system/security/password-policy.ts +191 -0
- package/src/system/startup-banner.ts +191 -0
- package/src/system/types/fastify.d.ts +53 -0
- package/src/system/utils/app-path.ts +31 -0
- package/src/system/utils/coerce.ts +28 -0
- package/src/system/utils/date-prefixed-log-stream.ts +176 -0
- package/src/system/utils/errors.ts +66 -0
- package/src/system/utils/format.ts +45 -0
- package/src/system/utils/http-client.ts +79 -0
- package/src/system/utils/user-agent.ts +82 -0
- package/tsconfig.app.json +17 -0
- package/tsconfig.json +39 -0
|
@@ -0,0 +1,567 @@
|
|
|
1
|
+
# LLM(대형 언어 모델) 가이드
|
|
2
|
+
|
|
3
|
+
OpenAI, Anthropic, Google Gemini, Ollama 등 다양한 LLM 프로바이더를 통한 채팅·RAG 기능 가이드입니다.
|
|
4
|
+
|
|
5
|
+
이 문서는 플러그인의 개요/설정/운영 가이드를 중심으로 다룹니다.
|
|
6
|
+
실제 라우트표, 호출 예제, 응답 예제는 [LLM Routes](../routes/llm-routes.md) 문서를 참고하세요.
|
|
7
|
+
|
|
8
|
+
---
|
|
9
|
+
|
|
10
|
+
## 목차
|
|
11
|
+
|
|
12
|
+
- [개요](#개요)
|
|
13
|
+
- [설정](#설정)
|
|
14
|
+
- [지원 드라이버 목록](#지원-드라이버-목록)
|
|
15
|
+
- [API 유형 비교](#api-유형-비교)
|
|
16
|
+
- [Profile Memory](#profile-memory)
|
|
17
|
+
- [프로바이더 비교](#프로바이더-비교)
|
|
18
|
+
- [클라우드 프로바이더](#클라우드-프로바이더)
|
|
19
|
+
- [로컬(자체 호스팅) 프로바이더](#로컬자체-호스팅-프로바이더)
|
|
20
|
+
- [성격·용도별 추천](#성격용도별-추천)
|
|
21
|
+
- [문서 처리](#-문서-처리)
|
|
22
|
+
- [대화·챗봇](#-대화--챗봇)
|
|
23
|
+
- [추론·분석](#-추론--분석)
|
|
24
|
+
- [코드·개발](#-코드--개발)
|
|
25
|
+
- [멀티모달·이미지](#️-멀티모달--이미지)
|
|
26
|
+
- [보안·인프라](#-보안--인프라)
|
|
27
|
+
- [성능 비교](#성능-비교)
|
|
28
|
+
- [종합 벤치마크](#종합-벤치마크)
|
|
29
|
+
- [한국어 벤치마크](#한국어-벤치마크)
|
|
30
|
+
- [코드 벤치마크](#코드-벤치마크)
|
|
31
|
+
- [추론 벤치마크](#추론-벤치마크)
|
|
32
|
+
- [속도·비용 효율](#속도비용-효율)
|
|
33
|
+
- [모델 비교](#모델-비교)
|
|
34
|
+
- [OpenAI](#openai-모델)
|
|
35
|
+
- [Anthropic](#anthropic-모델)
|
|
36
|
+
- [Google Gemini](#google-gemini-모델)
|
|
37
|
+
- [Meta Llama](#meta-llama-모델)
|
|
38
|
+
- [기타 클라우드 모델](#기타-클라우드-모델)
|
|
39
|
+
- [한국어 특화 모델](#한국어-특화-모델)
|
|
40
|
+
- [API 레퍼런스](#api-레퍼런스)
|
|
41
|
+
- [운영 팁](#운영-팁)
|
|
42
|
+
|
|
43
|
+
---
|
|
44
|
+
|
|
45
|
+
## 개요
|
|
46
|
+
|
|
47
|
+
Gateway의 LLM 플러그인은 여러 AI 프로바이더를 단일 API로 추상화합니다.
|
|
48
|
+
|
|
49
|
+
- 채팅 완성 (단발/스트리밍)
|
|
50
|
+
- 멀티턴 대화 세션 관리
|
|
51
|
+
- RAG (문서 업로드 → 벡터 검색 → 컨텍스트 주입)
|
|
52
|
+
- Profile Memory (사용자별 기억 항목 DB 저장 · 대화 시 system prompt 자동 주입)
|
|
53
|
+
- 사용량 추적
|
|
54
|
+
|
|
55
|
+
---
|
|
56
|
+
|
|
57
|
+
## 설정
|
|
58
|
+
|
|
59
|
+
`configs/plugins/llm.json`:
|
|
60
|
+
|
|
61
|
+
```json
|
|
62
|
+
{
|
|
63
|
+
"enabled": false,
|
|
64
|
+
"default": "main",
|
|
65
|
+
"providers": {
|
|
66
|
+
"main": {
|
|
67
|
+
"driver": "openai",
|
|
68
|
+
"api_key": "${LLM_OPENAI_API_KEY}",
|
|
69
|
+
"model": "gpt-4o-mini"
|
|
70
|
+
},
|
|
71
|
+
"chatbot": {
|
|
72
|
+
"driver": "anthropic",
|
|
73
|
+
"api_key": "${LLM_ANTHROPIC_API_KEY}",
|
|
74
|
+
"model": "claude-sonnet-4-20250514"
|
|
75
|
+
},
|
|
76
|
+
"summary": {
|
|
77
|
+
"driver": "gemini",
|
|
78
|
+
"api_key": "${LLM_GEMINI_API_KEY}",
|
|
79
|
+
"model": "gemini-2.0-flash"
|
|
80
|
+
},
|
|
81
|
+
"fast": {
|
|
82
|
+
"driver": "groq",
|
|
83
|
+
"api_key": "${LLM_GROQ_API_KEY}",
|
|
84
|
+
"model": "llama-3.3-70b-versatile"
|
|
85
|
+
},
|
|
86
|
+
"ollama": {
|
|
87
|
+
"driver": "ollama",
|
|
88
|
+
"base_url": "http://localhost:11434",
|
|
89
|
+
"model": "llama3.2:3b"
|
|
90
|
+
}
|
|
91
|
+
},
|
|
92
|
+
"cache": {
|
|
93
|
+
"enabled": true,
|
|
94
|
+
"ttl_seconds": 3600,
|
|
95
|
+
"max_entries": 10000
|
|
96
|
+
}
|
|
97
|
+
}
|
|
98
|
+
```
|
|
99
|
+
|
|
100
|
+
### 환경변수 (.env)
|
|
101
|
+
|
|
102
|
+
```env
|
|
103
|
+
LLM_OPENAI_API_KEY=sk-...
|
|
104
|
+
LLM_ANTHROPIC_API_KEY=sk-ant-...
|
|
105
|
+
LLM_GEMINI_API_KEY=AIza...
|
|
106
|
+
LLM_GROQ_API_KEY=gsk_...
|
|
107
|
+
```
|
|
108
|
+
|
|
109
|
+
### 지원 드라이버 목록
|
|
110
|
+
|
|
111
|
+
| driver | 유형 | 구현 방식 | 설명 |
|
|
112
|
+
| ----------------------- | -------- | ----------- | -------------------------------- |
|
|
113
|
+
| `openai` | 클라우드 | 전용 | OpenAI API |
|
|
114
|
+
| `anthropic` | 클라우드 | 전용 | Anthropic Claude |
|
|
115
|
+
| `gemini` | 클라우드 | 전용 | Google Gemini |
|
|
116
|
+
| `azure_openai` | 클라우드 | 전용 | Azure OpenAI (API-Key 헤더 구조) |
|
|
117
|
+
| `groq` | 클라우드 | OpenAI 호환 | Groq 초고속 추론 |
|
|
118
|
+
| `deepseek` | 클라우드 | OpenAI 호환 | DeepSeek |
|
|
119
|
+
| `mistral` | 클라우드 | OpenAI 호환 | Mistral AI |
|
|
120
|
+
| `together` | 클라우드 | OpenAI 호환 | Together AI |
|
|
121
|
+
| `perplexity` | 클라우드 | OpenAI 호환 | Perplexity AI |
|
|
122
|
+
| `ollama` | 로컬 | 전용 | Ollama 자체 프로토콜 |
|
|
123
|
+
| `vllm` | 로컬 | OpenAI 호환 | vLLM (`:8000`) |
|
|
124
|
+
| `lmstudio` | 로컬 | OpenAI 호환 | LM Studio (`:1234`) |
|
|
125
|
+
| `llamacpp` | 로컬 | OpenAI 호환 | llama.cpp server (`:8080`) |
|
|
126
|
+
| `koboldcpp` | 로컬 | OpenAI 호환 | KoboldCpp (`:5001`) |
|
|
127
|
+
| `text_generation_webui` | 로컬 | OpenAI 호환 | Text Generation WebUI (`:5000`) |
|
|
128
|
+
| `localai` | 로컬 | OpenAI 호환 | LocalAI (`:8080`) |
|
|
129
|
+
| `tabbyapi` | 로컬 | OpenAI 호환 | TabbyAPI / ExLlamaV2 (`:5000`) |
|
|
130
|
+
| `jan` | 로컬 | OpenAI 호환 | Jan Desktop (`:1337`) |
|
|
131
|
+
| `xinference` | 로컬 | OpenAI 호환 | Xinference (`:9997`) |
|
|
132
|
+
| `openwebui` | 로컬 | OpenAI 호환 | Open WebUI 프록시 (`:3000`) |
|
|
133
|
+
|
|
134
|
+
> **OpenAI 호환 driver**는 `base_url`을 직접 지정해 다른 호환 API 서버에도 연결할 수 있습니다.
|
|
135
|
+
|
|
136
|
+
---
|
|
137
|
+
|
|
138
|
+
## API 유형 비교
|
|
139
|
+
|
|
140
|
+
| 구분 | `/chat` | `/:name/chat` (template) | `/conversations` | `/chatbots/:seq/chat` |
|
|
141
|
+
| ------------------- | ----------------------- | -------------------------------- | ------------------------------------ | ------------------------------------- |
|
|
142
|
+
| **용도** | 자유 형식 단일 요청 | 미리 정의된 프롬프트 패턴 재사용 | 범용 지속 대화 (직접 세션 관리) | 봇 설정 기반 지속 대화 + RAG 통합 |
|
|
143
|
+
| **대화 히스토리** | ❌ 없음 | ❌ 없음 | ✅ 세션별 누적 | ✅ 세션별 누적 |
|
|
144
|
+
| **RAG 검색** | ❌ 없음 | ❌ 없음 | ❌ 없음 | ✅ 챗봇 설정에 따라 자동 수행 |
|
|
145
|
+
| **시스템 프롬프트** | 요청마다 직접 전달 | 템플릿 파일에 고정 | 세션 생성 시 1회 전달 | `llm_chatbot` 엔티티에 저장 |
|
|
146
|
+
| **봇 설정 (DB)** | ❌ 없음 | ❌ 없음 | ❌ 없음 | ✅ `llm_chatbot` 엔티티로 관리 |
|
|
147
|
+
| **세션 시작 방법** | 없음 (매번 독립 호출) | 없음 | `POST /conversations` 로 명시적 생성 | `session_seq=0` 전달 시 자동 생성 |
|
|
148
|
+
| **이어 대화 방법** | 없음 | 없음 | `POST /conversations/:seq/messages` | `session_seq` 재사용, 단일 엔드포인트 |
|
|
149
|
+
| **입력** | `messages[]` 배열 | `variables` 맵 (`{{var}}` 치환) | `message` 단일 문자열 | `message` 단일 문자열 |
|
|
150
|
+
| **주요 사용처** | 코드 내 단발성 LLM 호출 | 요약·번역 등 반복 작업 자동화 | 사용자별 채팅 로그 직접 구축 | 챗봇 UI, 고객 지원, 사내 Q&A |
|
|
151
|
+
|
|
152
|
+
> **선택 가이드**
|
|
153
|
+
>
|
|
154
|
+
> - 단순 프롬프트 → `/chat`
|
|
155
|
+
> - 변수를 주입하는 반복 패턴 → `/:name/chat`
|
|
156
|
+
> - 대화 맥락 유지, 설정 없이 직접 제어 → `/conversations`
|
|
157
|
+
> - 봇 설정 재사용 + 문서 기반 답변 → `/chatbots/:seq/chat`
|
|
158
|
+
|
|
159
|
+
> **conversations vs chatbots 선택 기준**
|
|
160
|
+
>
|
|
161
|
+
> 봇 페르소나란 챗봇에 부여하는 고정된 역할/성격 설정으로, 시스템 프롬프트·이름·환영 메시지 등을 묶어 DB에 저장한 것을 말한다.
|
|
162
|
+
> 예: "당신은 친절한 고객 지원 담당자입니다. 제공된 자료를 기반으로만 답변하세요."
|
|
163
|
+
>
|
|
164
|
+
> - **`/conversations`**: 봇 페르소나 없이 순수 대화 이력만 필요한 경우. 시스템 프롬프트·RAG를 직접 제어해야 하는 경우.
|
|
165
|
+
> - **`/chatbots/:seq/chat`**: 봇 설정(시스템 프롬프트·RAG·환영 메시지)을 DB에 저장하고 재사용해야 하는 경우. 여러 봇 인격을 운영할 때.
|
|
166
|
+
|
|
167
|
+
---
|
|
168
|
+
|
|
169
|
+
## Profile Memory
|
|
170
|
+
|
|
171
|
+
사용자별 기억 항목(이름·선호·목표 등)을 `llm_user_profile` 엔티티에 저장하고, 대화 시 system prompt에 자동 주입하는 기능입니다.
|
|
172
|
+
|
|
173
|
+
### 동작 방식
|
|
174
|
+
|
|
175
|
+
1. `POST /api/v1/llm/profiles` 로 항목 등록 (`user_seq + scope + key` 기준 upsert)
|
|
176
|
+
2. `POST /api/v1/llm/conversations` 또는 `chatbots/:seq/chat` 호출 시 `user_seq` 전달
|
|
177
|
+
3. 서버가 해당 사용자의 활성 메모리를 조회해 system prompt 뒤에 자동 삽입
|
|
178
|
+
|
|
179
|
+
### System Prompt 주입 예시
|
|
180
|
+
|
|
181
|
+
```
|
|
182
|
+
[사용자 메모리]
|
|
183
|
+
- name: 홍길동
|
|
184
|
+
- preference: 답변은 짧고 핵심만
|
|
185
|
+
- goal: React 마스터하기
|
|
186
|
+
```
|
|
187
|
+
|
|
188
|
+
### Scope (범위)
|
|
189
|
+
|
|
190
|
+
| scope 값 | 설명 |
|
|
191
|
+
| --------------- | ------------------------------ |
|
|
192
|
+
| `global` | 모든 대화에 공통 적용 (기본값) |
|
|
193
|
+
| `chatbot_{seq}` | 특정 챗봇에만 적용 |
|
|
194
|
+
|
|
195
|
+
챗봇 대화 시 `chatbot_{seq}` scope → `global` scope 순서로 fallback 조회합니다.
|
|
196
|
+
|
|
197
|
+
### 엔티티: llm_user_profile
|
|
198
|
+
|
|
199
|
+
| 필드 | 설명 |
|
|
200
|
+
| ------------- | ------------------------------------------- |
|
|
201
|
+
| `user_seq` | 소유 사용자 |
|
|
202
|
+
| `scope` | 메모리 범위 (`global` / `chatbot_{seq}`) |
|
|
203
|
+
| `chatbot_seq` | scope=chatbot 일 때 연결된 챗봇 |
|
|
204
|
+
| `key` | 메모리 키 (`name`, `preference` 등) |
|
|
205
|
+
| `value` | 메모리 값 (자연어 문장) |
|
|
206
|
+
| `source` | `manual`(직접 입력) / `extracted`(LLM 추출) |
|
|
207
|
+
| `status` | `active` / `inactive` |
|
|
208
|
+
|
|
209
|
+
> Profile Memory API 상세는 [LLM Routes — Profile Memory](../routes/llm-routes.md#get-v1apillmprofiles) 문서를 참고하세요.
|
|
210
|
+
|
|
211
|
+
---
|
|
212
|
+
|
|
213
|
+
## 프로바이더 비교
|
|
214
|
+
|
|
215
|
+
### 클라우드 프로바이더
|
|
216
|
+
|
|
217
|
+
| provider | driver | 대표 모델 | 한글 지원 | 비용 | 컨텍스트 창 | 강점 | 적합한 용도 |
|
|
218
|
+
| ------------- | -------------- | -------------------------------- | --------- | ------- | -------------- | --------------------------------------- | ----------------------------------------- |
|
|
219
|
+
| OpenAI | `openai` | gpt-4o, gpt-4o-mini, o1, o3 | ★★★★★ | 중~고 | 최대 128K | 생태계·도구 호환성 최고, 추론 모델 지원 | 범용, 코드 생성, 에이전트, JSON 모드 |
|
|
220
|
+
| Anthropic | `anthropic` | claude-opus-4, claude-sonnet-4 | ★★★★★ | 중~고 | 최대 200K | 긴 문서 처리, 안전성, 지시 준수 | 문서 요약, 고품질 글쓰기, 정교한 지시사항 |
|
|
221
|
+
| Google Gemini | `gemini` | gemini-2.5-pro, gemini-2.0-flash | ★★★★★ | 저~중 | 최대 1M (Pro) | 멀티모달, 초장문 컨텍스트 | 이미지·영상 분석, 대문서 처리 |
|
|
222
|
+
| Groq | `groq` | llama-3.3-70b, mixtral-8x7b | ★★★☆☆ | 저 | 최대 128K | LPU 기반 초고속 추론 (최저 레이턴시) | 실시간 챗봇, 저지연 API, 빠른 요약 |
|
|
223
|
+
| DeepSeek | `deepseek` | deepseek-chat, deepseek-reasoner | ★★★★☆ | 매우 저 | 최대 64K | 비용 대비 성능 최상, 추론(CoT) 특화 | 비용 최적화, 수학·코드 추론 |
|
|
224
|
+
| Mistral AI | `mistral` | mistral-large, mistral-small | ★★★☆☆ | 저~중 | 최대 128K | 유럽 GDPR 준수, 경량 고성능 | 유럽 서비스, 유연한 라이선스 |
|
|
225
|
+
| Together AI | `together` | Llama-3.3, Qwen-2.5, DBRX 등 | ★★★☆☆ | 저 | 모델 의존 | 다양한 오픈소스 모델 API 제공 | 오픈소스 모델 실험, 비용 절감 |
|
|
226
|
+
| Perplexity | `perplexity` | sonar-pro, sonar-reasoning | ★★★★☆ | 중 | 최대 127K | 실시간 웹 검색 자동 통합 | 최신 정보 답변, 검색 증강 Q&A |
|
|
227
|
+
| Azure OpenAI | `azure_openai` | gpt-4o (배포판) | ★★★★★ | 중~고 | 배포 설정 의존 | 엔터프라이즈 SLA, VNet 격리 | 금융·공공 등 컴플라이언스 필요 환경 |
|
|
228
|
+
|
|
229
|
+
> **비용 기준**: 매우 저 < 저 < 중 < 고 (입력 1M 토큰 기준 상대 비교, 2026년 초 기준)
|
|
230
|
+
|
|
231
|
+
---
|
|
232
|
+
|
|
233
|
+
### 로컬(자체 호스팅) 프로바이더
|
|
234
|
+
|
|
235
|
+
| provider | driver | 추론 백엔드 | GPU 필요 | 처리량 | 한글 지원 | 설치 난이도 | 강점 | 적합한 용도 |
|
|
236
|
+
| --------------------- | ----------------------- | -------------- | --------- | ------ | --------- | ------------ | ----------------------------------- | --------------------------------- |
|
|
237
|
+
| Ollama | `ollama` | llama.cpp 내장 | ❌ (권장) | ★★★☆☆ | 모델 의존 | ★☆☆☆☆ 쉬움 | 설치 한 줄, 모델 자동 다운로드 | 개발·테스트, 보안 민감 데이터 |
|
|
238
|
+
| vLLM | `vllm` | PagedAttention | ✅ 필수 | ★★★★★ | 모델 의존 | ★★★★☆ 어려움 | 최고 처리량, OpenAI 호환 서버 | 프로덕션 GPU 서버, 대량 배치 추론 |
|
|
239
|
+
| LM Studio | `lmstudio` | llama.cpp 기반 | ❌ (권장) | ★★★☆☆ | 모델 의존 | ★☆☆☆☆ 쉬움 | GUI로 모델 관리, 개발자 친화적 | 로컬 개발 환경, 모델 실험 |
|
|
240
|
+
| llama.cpp | `llamacpp` | CPU/Metal/CUDA | ❌ | ★★★☆☆ | 모델 의존 | ★★★☆☆ 보통 | CPU 추론 가능, 경량, GGUF 포맷 | CPU 전용 서버, 저사양 환경 |
|
|
241
|
+
| KoboldCpp | `koboldcpp` | llama.cpp 기반 | ❌ | ★★★☆☆ | 모델 의존 | ★★☆☆☆ 쉬움 | 창작/롤플레이 특화 샘플링 옵션 | 창작 보조, 캐릭터 챗봇 |
|
|
242
|
+
| Text Generation WebUI | `text_generation_webui` | 다중 백엔드 | ❌ (권장) | ★★★☆☆ | 모델 의존 | ★★★☆☆ 보통 | 다양한 모델 포맷·백엔드 지원 | 모델 실험·비교, 연구 목적 |
|
|
243
|
+
| LocalAI | `localai` | 다중 백엔드 | ❌ | ★★★☆☆ | 모델 의존 | ★★★☆☆ 보통 | OpenAI API 완전 호환, 멀티모달 지원 | 기존 OpenAI 코드 오프라인 전환 |
|
|
244
|
+
| TabbyAPI | `tabbyapi` | ExLlamaV2 | ✅ 권장 | ★★★★☆ | 모델 의존 | ★★★☆☆ 보통 | EXL2 양자화로 VRAM 효율 극대화 | 고성능 로컬 서버, 코드 자동완성 |
|
|
245
|
+
|
|
246
|
+
> **설치 난이도 기준**: ★☆☆☆☆ 매우 쉬움 ~ ★★★★★ 매우 어려움
|
|
247
|
+
> **한글 지원 (로컬)**: 로컬 서버는 로드하는 모델에 따라 한글 품질이 결정됩니다. 한글에 강한 모델로는 EXAONE-3.5, HyperCLOVA X, Qwen-2.5 (한글 포함 다국어), Llama-3-Korean-Bllossom 계열을 권장합니다.
|
|
248
|
+
|
|
249
|
+
---
|
|
250
|
+
|
|
251
|
+
### 성격·용도별 추천
|
|
252
|
+
|
|
253
|
+
#### 📄 문서 처리
|
|
254
|
+
|
|
255
|
+
| 용도 | 1순위 추천 | 대안 | 추천 이유 |
|
|
256
|
+
| ----------------------------- | --------------------------------------- | ----------------------------- | --------------------------------------------------------------- |
|
|
257
|
+
| 장문 문서 요약 (10만 자 이상) | Gemini 2.5 Pro | Anthropic claude-sonnet-4 | 1M 컨텍스트로 문서 전체를 한 번에 처리 |
|
|
258
|
+
| 단문 요약 · 뉴스 요약 | Groq (llama-3.3-70b) | gpt-4o-mini, gemini-2.0-flash | 저비용 고속, 간단한 요약은 경량 모델로 충분 |
|
|
259
|
+
| 계약서 · 법률 문서 분석 | Anthropic claude-opus-4 | gpt-4o | 긴 지시사항 준수율·안전성 최고, 섬세한 조건 해석 |
|
|
260
|
+
| PDF/문서 OCR 후 내용 추출 | Gemini 2.0 Flash | gpt-4o (vision) | 멀티모달 + 저비용 고속, 이미지 포함 PDF 처리에 유리 |
|
|
261
|
+
| 다국어 문서 번역 (한↔영↔중) | DeepSeek V3 또는 Qwen-2.5-72B | gpt-4o, claude-sonnet-4 | 한·중·영 3개 언어 모두 우수하며 비용 대비 품질 탁월 |
|
|
262
|
+
| 한국어 문서 요약·분류 | EXAONE-3.5-32B (로컬) 또는 Qwen-2.5-72B | claude-sonnet-4, HyperCLOVA X | 한국어 뉘앙스·고유명사 처리 최적, 데이터 보안 필요 시 로컬 권장 |
|
|
263
|
+
|
|
264
|
+
---
|
|
265
|
+
|
|
266
|
+
#### 💬 대화 · 챗봇
|
|
267
|
+
|
|
268
|
+
| 용도 | 1순위 추천 | 대안 | 추천 이유 |
|
|
269
|
+
| ---------------------------- | -------------------------------------- | ---------------------------------- | -------------------------------------------------------- |
|
|
270
|
+
| 고객 지원 챗봇 (한국어) | claude-sonnet-4 | Kanana-1.5-8B (로컬), HyperCLOVA X | 지시 준수율·자연스러운 한국어 표현 최고 |
|
|
271
|
+
| 실시간 응답 요구 챗봇 | Groq (llama-3.3-70b) | Gemini 2.0 Flash | LPU로 평균 0.5초 이하 첫 토큰 응답 |
|
|
272
|
+
| 다중 봇 인격 운영 (RAG 포함) | Anthropic claude-sonnet-4 | gpt-4o | `/chatbots/:seq/chat` + RAG 플로우에 최적 |
|
|
273
|
+
| 창작 · 롤플레이 챗봇 | KoboldCpp + 로컬 모델 | claude-sonnet-4 | 창작 특화 샘플링 파라미터, 사내 데이터 유출 없음 |
|
|
274
|
+
| FAQ 자동 응답 (저비용 대량) | gpt-4o-mini 또는 gemini-2.0-flash-lite | DeepSeek V3 | 1M 토큰당 $0.075~$0.15 수준, 단순 FAQ는 소형 모델로 충분 |
|
|
275
|
+
| 음성 기반 실시간 대화 | OpenAI gpt-4o-realtime | — | 음성 입출력 네이티브 지원, 별도 STT/TTS 불필요 |
|
|
276
|
+
|
|
277
|
+
---
|
|
278
|
+
|
|
279
|
+
#### 🧠 추론 · 분석
|
|
280
|
+
|
|
281
|
+
| 용도 | 1순위 추천 | 대안 | 추천 이유 |
|
|
282
|
+
| ------------------------------ | --------------------------- | -------------- | ---------------------------------------------------------- |
|
|
283
|
+
| 복잡한 수학 · 과학 문제 | OpenAI o3 | DeepSeek R1 | 사고 연쇄(Chain-of-Thought) 추론 성능 최상 |
|
|
284
|
+
| 비용 효율적 추론 | DeepSeek R1 | OpenAI o3-mini | o1 수준 추론을 1/10 비용으로, 수학·코드·논리에 특화 |
|
|
285
|
+
| 비즈니스 데이터 분석 · 리포트 | gpt-4o 또는 claude-sonnet-4 | Gemini 2.5 Pro | 구조적 출력(JSON mode)과 긴 컨텍스트 분석 모두 안정적 |
|
|
286
|
+
| 금융 · 법률 컴플라이언스 분석 | Azure OpenAI (gpt-4o) | claude-opus-4 | 엔터프라이즈 SLA + VNet 격리, 데이터 주권 보장 |
|
|
287
|
+
| 경쟁사 · 시장 조사 (최신 정보) | Perplexity sonar-pro | — | 실시간 웹 검색 자동 통합, GPT에 웹 검색 붙이는 것보다 간편 |
|
|
288
|
+
|
|
289
|
+
---
|
|
290
|
+
|
|
291
|
+
#### 💻 코드 · 개발
|
|
292
|
+
|
|
293
|
+
| 용도 | 1순위 추천 | 대안 | 추천 이유 |
|
|
294
|
+
| ------------------------ | ------------------------------- | ----------------------- | ----------------------------------------------------------- |
|
|
295
|
+
| 코드 생성 · 리뷰 (범용) | gpt-4o 또는 claude-sonnet-4 | DeepSeek V3 | 도구 호출·JSON mode 안정성 최고, 긴 코드 컨텍스트 처리 우수 |
|
|
296
|
+
| 코드 자동완성 (로컬 IDE) | TabbyAPI + Qwen-2.5-Coder-32B | Ollama + deepseek-coder | ExLlamaV2 양자화로 VRAM 효율 극대화, 저지연 completions |
|
|
297
|
+
| 코드 추론 · 버그 분석 | DeepSeek R1 또는 OpenAI o3 | claude-opus-4 | CoT 기반 단계적 디버깅, 복잡한 알고리즘 분석에 강점 |
|
|
298
|
+
| SQL/데이터 쿼리 생성 | gpt-4o-mini 또는 Qwen-2.5-Coder | claude-haiku-3.5 | 구조화된 쿼리 생성에 소형 모델도 충분, 비용 절감 가능 |
|
|
299
|
+
| 테스트 코드 자동 생성 | claude-sonnet-4 | gpt-4o | 지시사항 준수율 높고 엣지케이스 자동 식별 능력 우수 |
|
|
300
|
+
|
|
301
|
+
---
|
|
302
|
+
|
|
303
|
+
#### 🖼️ 멀티모달 · 이미지
|
|
304
|
+
|
|
305
|
+
| 용도 | 1순위 추천 | 대안 | 추천 이유 |
|
|
306
|
+
| --------------------------- | ----------------------------- | -------------------- | --------------------------------------------------- |
|
|
307
|
+
| 이미지 → 텍스트 설명 (대량) | Gemini 2.0 Flash | gpt-4o-mini (vision) | 저비용 + 이미지 처리 성능 우수, 배치 처리에 적합 |
|
|
308
|
+
| 정밀 이미지 분석 · OCR | gpt-4o 또는 Gemini 2.5 Pro | claude-sonnet-4 | 세밀한 시각 분석, 복잡한 표/그래프 해석 |
|
|
309
|
+
| 영상 프레임 분석 | Gemini 2.0 Flash | — | 영상 직접 입력 지원 (YouTube URL, 업로드 모두 가능) |
|
|
310
|
+
| 로컬 이미지 분석 (보안) | Ollama + Llama-3.2-11B-Vision | LM Studio + LLaVA | GPU 없이도 CPU로 동작 가능, 이미지 외부 전송 없음 |
|
|
311
|
+
|
|
312
|
+
---
|
|
313
|
+
|
|
314
|
+
#### 🔒 보안 · 인프라
|
|
315
|
+
|
|
316
|
+
| 용도 | 1순위 추천 | 대안 | 추천 이유 |
|
|
317
|
+
| ------------------------- | ----------------------------------------- | -------------------------------- | ----------------------------------------------- |
|
|
318
|
+
| 내부망 전용 (인터넷 차단) | vLLM + EXAONE-3.5 또는 Qwen-2.5 | Ollama (소규모) | 완전 오프라인 운영, 외부 API 호출 없음 |
|
|
319
|
+
| 의료 · 금융 개인정보 처리 | Ollama/vLLM 자체 호스팅 | Azure OpenAI (HIPAA BAA 체결 시) | 데이터가 외부 서버에 전송되지 않음 |
|
|
320
|
+
| 고가용성 프로덕션 서비스 | vLLM (GPU 서버) 또는 Azure OpenAI | Together AI | SLA 보장, 트래픽 스파이크에 수평 확장 가능 |
|
|
321
|
+
| 공공기관 · ISMS-P 준수 | Azure OpenAI (국내 리전) 또는 자체 호스팅 | — | 국내 데이터 주권 요건 충족, 감사 로그 보관 가능 |
|
|
322
|
+
|
|
323
|
+
---
|
|
324
|
+
|
|
325
|
+
## 성능 비교
|
|
326
|
+
|
|
327
|
+
> 아래 수치는 공개된 벤치마크 결과 및 리더보드(Chatbot Arena, LMSYS, LiveBench 등) 기준이며, 모델 버전·프롬프트·측정 방법에 따라 달라질 수 있습니다. (2026년 초 기준)
|
|
328
|
+
|
|
329
|
+
---
|
|
330
|
+
|
|
331
|
+
### 종합 벤치마크
|
|
332
|
+
|
|
333
|
+
주요 평가 지표:
|
|
334
|
+
|
|
335
|
+
- **MMLU** — 57개 분야 지식 측정 (0~100, 높을수록 좋음)
|
|
336
|
+
- **GPQA Diamond** — 과학 전문가 수준 추론 (0~100)
|
|
337
|
+
- **Chatbot Arena ELO** — 인간 선호도 평가 (높을수록 선호)
|
|
338
|
+
- **LiveBench** — 최신 문제 기반 종합 능력 (0~100)
|
|
339
|
+
|
|
340
|
+
| 모델 | MMLU | GPQA Diamond | Chatbot Arena ELO | LiveBench | 비고 |
|
|
341
|
+
| ---------------- | ---- | ------------ | ----------------- | --------- | ------------------------------- |
|
|
342
|
+
| OpenAI o3 | 96.7 | 87.7 | ~1400 | 79.3 | 추론 최강, 느린 응답 감수 필요 |
|
|
343
|
+
| claude-opus-4 | 95.0 | 82.1 | ~1380 | 75.8 | 장문 분석·지시 준수 최상 |
|
|
344
|
+
| Gemini 2.5 Pro | 95.2 | 84.0 | ~1420 | 78.5 | 멀티모달·초장문 컨텍스트 최강 |
|
|
345
|
+
| gpt-4o | 88.7 | 53.6 | ~1320 | 58.1 | 균형잡힌 범용 모델 |
|
|
346
|
+
| claude-sonnet-4 | 90.2 | 70.3 | ~1350 | 66.4 | 성능·속도·비용 최적 균형 |
|
|
347
|
+
| DeepSeek V3 | 88.5 | 59.1 | ~1310 | 60.2 | 비용 대비 gpt-4o급 성능 |
|
|
348
|
+
| DeepSeek R1 | 90.8 | 71.5 | ~1340 | 67.9 | 오픈소스 추론 모델 최강 |
|
|
349
|
+
| Qwen-2.5-72B | 86.1 | 49.0 | ~1240 | 52.3 | 다국어(한·중·영) 특화 |
|
|
350
|
+
| Llama-3.3-70B | 86.0 | 50.7 | ~1250 | 53.1 | 오픈소스 대비 우수한 범용 성능 |
|
|
351
|
+
| Gemini 2.0 Flash | 83.5 | 51.5 | ~1220 | 49.7 | 고속·저비용 실용 모델 |
|
|
352
|
+
| gpt-4o-mini | 82.0 | 40.2 | ~1190 | 43.5 | 저비용 경량, 단순 작업 최적 |
|
|
353
|
+
| mistral-large-2 | 84.0 | 49.0 | ~1230 | 50.1 | 유럽 GDPR 준수, 범용 균형 |
|
|
354
|
+
| EXAONE-3.5-32B | 78.5 | 38.0 | — | — | 한국어 특화, 오픈소스 최대 규모 |
|
|
355
|
+
|
|
356
|
+
---
|
|
357
|
+
|
|
358
|
+
### 한국어 벤치마크
|
|
359
|
+
|
|
360
|
+
주요 평가 지표:
|
|
361
|
+
|
|
362
|
+
- **KoMT-Bench** — 한국어 멀티턴 대화 능력 (0~10)
|
|
363
|
+
- **KMMLU** — 한국어 지식 평가 MMLU (0~100)
|
|
364
|
+
- **Ko-IFEval** — 한국어 지시사항 따르기 (0~100)
|
|
365
|
+
|
|
366
|
+
| 모델 | KoMT-Bench | KMMLU | Ko-IFEval | 비고 |
|
|
367
|
+
| -------------------------- | ---------- | ----- | --------- | -------------------------------------- |
|
|
368
|
+
| claude-sonnet-4 | 9.1 | 78.2 | 88.5 | 자연스러운 한국어 표현, 지시 준수 최고 |
|
|
369
|
+
| gpt-4o | 8.9 | 77.6 | 87.3 | 균형잡힌 한국어 성능 |
|
|
370
|
+
| Gemini 2.5 Pro | 9.0 | 79.1 | 86.9 | 한국어 장문 처리 우수 |
|
|
371
|
+
| HyperCLOVA X | 9.2 | 82.0 | 90.1 | 한국 문화·비즈니스 맥락 이해 최상 |
|
|
372
|
+
| EXAONE-3.5-32B | 8.7 | 80.5 | 85.3 | 오픈소스 한국어 모델 최강 |
|
|
373
|
+
| Kanana-1.5-8B | 8.3 | 76.1 | 82.0 | 경량 한국어 특화, 로컬 실행 가능 |
|
|
374
|
+
| Qwen-2.5-72B | 8.5 | 73.4 | 80.7 | 한·중·영 다국어 우수 |
|
|
375
|
+
| DeepSeek V3 | 8.2 | 71.8 | 79.5 | 저비용 대비 한국어 준수 |
|
|
376
|
+
| Llama-3-Korean-Bllossom-8B | 7.8 | 68.5 | 74.2 | 로컬 한국어 경량 파인튜닝 모델 |
|
|
377
|
+
| SOLAR-10.7B | 7.9 | 69.2 | 75.8 | 상용 가능 한국어 특화 오픈소스 |
|
|
378
|
+
|
|
379
|
+
> HyperCLOVA X는 별도 API 계약 필요. EXAONE·Kanana·SOLAR는 로컬(Ollama/vLLM) 또는 API 제공 서비스 경유 연동.
|
|
380
|
+
|
|
381
|
+
---
|
|
382
|
+
|
|
383
|
+
### 코드 벤치마크
|
|
384
|
+
|
|
385
|
+
주요 평가 지표:
|
|
386
|
+
|
|
387
|
+
- **HumanEval** — Python 함수 생성 정확도 (pass@1, %)
|
|
388
|
+
- **SWE-bench Verified** — GitHub 실제 버그 수정 능력 (%)
|
|
389
|
+
- **MBPP** — 기본 Python 프로그래밍 문제 (pass@1, %)
|
|
390
|
+
|
|
391
|
+
| 모델 | HumanEval | SWE-bench | MBPP | 비고 |
|
|
392
|
+
| ------------------ | --------- | --------- | ---- | ------------------------------------ |
|
|
393
|
+
| OpenAI o3 | 99.2 | 71.7 | 95.8 | 코드 추론·버그 수정 최강 |
|
|
394
|
+
| claude-sonnet-4 | 96.4 | 70.3 | 93.5 | 코드 생성·리뷰, 엣지케이스 처리 우수 |
|
|
395
|
+
| gpt-4o | 90.2 | 49.2 | 87.8 | 범용 코드 생성 안정적 |
|
|
396
|
+
| DeepSeek V3 | 91.6 | 42.0 | 89.3 | 비용 대비 코드 성능 탁월 |
|
|
397
|
+
| DeepSeek R1 | 92.6 | 50.0 | 90.2 | 추론 기반 코드 분석 강점 |
|
|
398
|
+
| Qwen-2.5-Coder-32B | 92.7 | 43.5 | 90.1 | 코드 특화 파인튜닝, GPT-4o 수준 |
|
|
399
|
+
| claude-haiku-3.5 | 87.5 | 40.6 | 84.5 | 빠르고 저렴한 코드 정리·포맷팅 |
|
|
400
|
+
| Llama-3.3-70B | 85.1 | 37.0 | 82.3 | 오픈소스 코드 모델 중 상위권 |
|
|
401
|
+
| gpt-4o-mini | 87.2 | 35.5 | 84.0 | 저비용 SQL·단순 스크립트 생성 |
|
|
402
|
+
|
|
403
|
+
---
|
|
404
|
+
|
|
405
|
+
### 추론 벤치마크
|
|
406
|
+
|
|
407
|
+
주요 평가 지표:
|
|
408
|
+
|
|
409
|
+
- **MATH-500** — 수학 올림피아드 수준 문제 (%)
|
|
410
|
+
- **AIME 2024** — 미국 수학경시대회 (문제 수/30)
|
|
411
|
+
- **ARC-Challenge** — 과학 추론 문제 (%)
|
|
412
|
+
|
|
413
|
+
| 모델 | MATH-500 | AIME 2024 | ARC-Challenge | 비고 |
|
|
414
|
+
| -------------- | -------- | --------- | ------------- | ------------------------------------ |
|
|
415
|
+
| OpenAI o3 | 99.2 | 28.3/30 | 98.0 | 수학·과학 추론 절대 1위 |
|
|
416
|
+
| OpenAI o3-mini | 97.0 | 26.7/30 | 96.4 | o3 대비 빠르고 저렴한 추론 |
|
|
417
|
+
| DeepSeek R1 | 97.3 | 26.0/30 | 96.3 | 오픈소스 추론 모델 o3-mini 수준 |
|
|
418
|
+
| Gemini 2.5 Pro | 97.0 | 27.0/30 | 97.1 | 추론+멀티모달 결합 강점 |
|
|
419
|
+
| claude-opus-4 | 95.0 | 23.4/30 | 96.7 | 복잡한 다단계 추론 우수 |
|
|
420
|
+
| gpt-4o | 76.6 | 13.4/30 | 96.3 | 범용 추론, 수학은 o-시리즈 대비 약세 |
|
|
421
|
+
| DeepSeek V3 | 90.2 | 20.0/30 | 95.5 | 비추론 모델 중 수학 성능 최상 |
|
|
422
|
+
| Llama-3.3-70B | 77.0 | 11.0/30 | 94.8 | 오픈소스 범용 추론 상위권 |
|
|
423
|
+
|
|
424
|
+
---
|
|
425
|
+
|
|
426
|
+
### 속도·비용 효율
|
|
427
|
+
|
|
428
|
+
> **TPS**: 초당 출력 토큰 수 (높을수록 빠름, 클라우드 환경 측정값)
|
|
429
|
+
|
|
430
|
+
| 모델 | TPS (평균) | 입력 비용<br>($/1M tok) | 출력 비용<br>($/1M tok) | 비용 대비 성능 | 비고 |
|
|
431
|
+
| --------------------- | ---------- | ----------------------- | ----------------------- | -------------- | ----------------------------------------- |
|
|
432
|
+
| Groq llama-3.3-70b | ~1,400 | $0.59 | $0.79 | ★★★★★ | 클라우드 최고속 (LPU), 저비용 |
|
|
433
|
+
| Gemini 2.0 Flash | ~500 | $0.10 | $0.40 | ★★★★★ | 저비용·고속 균형, 배치 처리 최적 |
|
|
434
|
+
| gpt-4o-mini | ~230 | $0.15 | $0.60 | ★★★★☆ | OpenAI 경량 모델, 범용 저비용 |
|
|
435
|
+
| DeepSeek V3 | ~200 | $0.27 | $1.10 | ★★★★★ | GPT-4o급 성능을 1/10 비용으로 |
|
|
436
|
+
| claude-haiku-3.5 | ~450 | $0.80 | $4.00 | ★★★★☆ | 빠른 Anthropic 경량, 요약·분류에 최적 |
|
|
437
|
+
| Gemini 2.0 Flash Lite | ~600 | $0.075 | $0.30 | ★★★★★ | 최저 비용, 단순 작업 대량 처리 |
|
|
438
|
+
| Mistral Small 3 | ~350 | $0.10 | $0.30 | ★★★★★ | Apache 2.0, 저비용 유럽 서버 |
|
|
439
|
+
| claude-sonnet-4 | ~150 | $3.00 | $15.00 | ★★★☆☆ | 고성능 균형, 프리미엄 비용 감수 |
|
|
440
|
+
| gpt-4o | ~120 | $2.50 | $10.00 | ★★★☆☆ | 범용 플래그십, 중간 비용 |
|
|
441
|
+
| OpenAI o3 | ~30 | $10.00 | $40.00 | ★★☆☆☆ | 최고 성능, 최고 비용·느린 응답 |
|
|
442
|
+
| DeepSeek R1 | ~80 | $0.55 | $2.19 | ★★★★★ | 추론 모델 중 압도적 비용 효율 |
|
|
443
|
+
| Ollama (로컬 GPU) | ~50~300 | $0 (전기비) | $0 (전기비) | ★★★★★ | 초기 GPU 비용 제외 시 장기 운영 최저 비용 |
|
|
444
|
+
|
|
445
|
+
> **TPS는 하드웨어·네트워크·프롬프트 길이에 따라 크게 달라집니다.** 위 수치는 표준 프롬프트 기준 참고값입니다.
|
|
446
|
+
|
|
447
|
+
---
|
|
448
|
+
|
|
449
|
+
## 모델 비교
|
|
450
|
+
|
|
451
|
+
> **연동 가능 여부 범례**
|
|
452
|
+
>
|
|
453
|
+
> - ✅ **지원** — 해당 프로바이더 driver로 `model` 필드에 그대로 지정하면 즉시 사용 가능
|
|
454
|
+
> - ⚠️ **조건부** — API 접근 신청·웨이팅리스트·별도 계약 필요, 또는 특정 플랜 이상에서만 사용 가능
|
|
455
|
+
> - 🔶 **로컬만** — 자체 호스팅(Ollama, vLLM 등)을 통해서만 사용 가능
|
|
456
|
+
> - ❌ **불가** — API 미제공 또는 현재 지원하지 않는 프로바이더
|
|
457
|
+
|
|
458
|
+
---
|
|
459
|
+
|
|
460
|
+
### OpenAI 모델
|
|
461
|
+
|
|
462
|
+
| 모델 | 유형 | 컨텍스트 | 입력 비용<br>($/1M tok) | 출력 비용<br>($/1M tok) | 한글 지원 | 특징 | 연동 가능 |
|
|
463
|
+
| --------------- | ------------- | -------- | ----------------------- | ----------------------- | --------- | --------------------------------- | :---------: |
|
|
464
|
+
| gpt-4o | 멀티모달 | 128K | $2.50 | $10.00 | ★★★★★ | 이미지 입력, 균형잡힌 성능 | ✅ |
|
|
465
|
+
| gpt-4o-mini | 경량 | 128K | $0.15 | $0.60 | ★★★★☆ | 저비용 고속, 일상적 작업에 최적 | ✅ |
|
|
466
|
+
| gpt-4.1 | 최신 플래그십 | 1M | $2.00 | $8.00 | ★★★★★ | 초장문 컨텍스트, 코드·지시 강화 | ✅ |
|
|
467
|
+
| gpt-4.1-mini | 경량 | 1M | $0.40 | $1.60 | ★★★★☆ | gpt-4.1 경량판, 빠른 긴 문서 처리 | ✅ |
|
|
468
|
+
| o3 | 추론 | 200K | $10.00 | $40.00 | ★★★★★ | 복잡한 수학·과학·코드 추론 최강 | ✅ |
|
|
469
|
+
| o3-mini | 추론 경량 | 200K | $1.10 | $4.40 | ★★★★☆ | o3 대비 빠른 추론, 비용 절감 | ✅ |
|
|
470
|
+
| o4-mini | 추론 경량 | 200K | $1.10 | $4.40 | ★★★★☆ | 멀티모달 추론, 이미지 분석 가능 | ✅ |
|
|
471
|
+
| gpt-4o-realtime | 실시간 음성 | 128K | $5.00 (오디오) | $20.00 (오디오) | ★★★★☆ | 저지연 음성 입출력 (WebSocket) | ⚠️ 별도 API |
|
|
472
|
+
|
|
473
|
+
> 비용은 2026년 초 기준 공개된 가격이며 변경될 수 있습니다.
|
|
474
|
+
|
|
475
|
+
---
|
|
476
|
+
|
|
477
|
+
### Anthropic 모델
|
|
478
|
+
|
|
479
|
+
| 모델 | 유형 | 컨텍스트 | 입력 비용<br>($/1M tok) | 출력 비용<br>($/1M tok) | 한글 지원 | 특징 | 연동 가능 |
|
|
480
|
+
| ------------------------ | ----------- | -------- | ----------------------- | ----------------------- | --------- | --------------------------------------- | :-------: |
|
|
481
|
+
| claude-opus-4 | 플래그십 | 200K | $15.00 | $75.00 | ★★★★★ | 최고 성능, 복잡한 추론·장문 분석 | ✅ |
|
|
482
|
+
| claude-sonnet-4 | 균형 | 200K | $3.00 | $15.00 | ★★★★★ | 성능·속도·비용 최적 균형, 실무 주력 | ✅ |
|
|
483
|
+
| claude-haiku-3.5 | 경량 고속 | 200K | $0.80 | $4.00 | ★★★★☆ | 가장 빠름, 단순 분류·요약에 최적 | ✅ |
|
|
484
|
+
| claude-opus-4 (extended) | 장시간 추론 | 200K | $15.00+ | $75.00+ | ★★★★★ | 확장 사고(extended thinking), 깊은 분석 | ⚠️ 베타 |
|
|
485
|
+
|
|
486
|
+
---
|
|
487
|
+
|
|
488
|
+
### Google Gemini 모델
|
|
489
|
+
|
|
490
|
+
| 모델 | 유형 | 컨텍스트 | 입력 비용<br>($/1M tok) | 출력 비용<br>($/1M tok) | 한글 지원 | 특징 | 연동 가능 |
|
|
491
|
+
| --------------------- | -------- | -------- | ----------------------- | ----------------------- | --------- | ------------------------------------ | :-------: |
|
|
492
|
+
| gemini-2.5-pro | 플래그십 | 1M | $1.25 (≤200K) | $10.00 | ★★★★★ | 최장 컨텍스트, 멀티모달, 딥 추론 | ✅ |
|
|
493
|
+
| gemini-2.0-flash | 고속 | 1M | $0.10 | $0.40 | ★★★★★ | 초고속·저비용, 실시간 처리 최적 | ✅ |
|
|
494
|
+
| gemini-2.0-flash-lite | 경량 | 1M | $0.075 | $0.30 | ★★★★☆ | 최저 비용, 간단한 작업용 | ✅ |
|
|
495
|
+
| gemini-2.5-flash | 균형 | 1M | $0.15 | $0.60 | ★★★★★ | Pro 대비 고속·저비용, 추론 기능 포함 | ✅ |
|
|
496
|
+
| gemini-1.5-pro | 구세대 | 2M | $1.25 (≤128K) | $5.00 | ★★★★★ | 2M 컨텍스트, 레거시 호환용 | ✅ |
|
|
497
|
+
|
|
498
|
+
---
|
|
499
|
+
|
|
500
|
+
### Meta Llama 모델
|
|
501
|
+
|
|
502
|
+
| 모델 | 파라미터 | 컨텍스트 | 한글 지원 | 특징 | 연동 방법 | 연동 가능 |
|
|
503
|
+
| ----------------------- | -------- | -------- | --------- | ---------------------------- | ---------------------------- | :-------: |
|
|
504
|
+
| Llama-3.3-70B-Instruct | 70B | 128K | ★★★☆☆ | 오픈소스 최고 성능 중 하나 | Groq, Together, Ollama, vLLM | ✅ |
|
|
505
|
+
| Llama-3.1-405B-Instruct | 405B | 128K | ★★★☆☆ | Meta 최대 규모, GPT-4급 성능 | Together AI, 자체 GPU | ✅ |
|
|
506
|
+
| Llama-3.2-11B-Vision | 11B | 128K | ★★★☆☆ | 멀티모달(이미지 입력) 지원 | Together, Groq, Ollama | ✅ |
|
|
507
|
+
| Llama-3.2-3B-Instruct | 3B | 128K | ★★☆☆☆ | 엣지/로컬 경량 추론 | Ollama, llama.cpp | 🔶 |
|
|
508
|
+
| Llama-3.1-8B-Instruct | 8B | 128K | ★★☆☆☆ | 로컬 실행 가능한 균형 모델 | Groq, Ollama, vLLM | ✅ |
|
|
509
|
+
|
|
510
|
+
---
|
|
511
|
+
|
|
512
|
+
### 기타 클라우드 모델
|
|
513
|
+
|
|
514
|
+
| 모델 | 제공사 | 파라미터 | 컨텍스트 | 입력 비용<br>($/1M tok) | 한글 지원 | 특징 | 연동 가능 |
|
|
515
|
+
| ---------------------- | ---------- | -------- | -------- | ----------------------- | --------- | --------------------------------------- | :----------------------: |
|
|
516
|
+
| deepseek-chat (V3) | DeepSeek | 685B MoE | 64K | $0.27 | ★★★★☆ | GPT-4급 성능, 압도적 저비용 | ✅ |
|
|
517
|
+
| deepseek-reasoner (R1) | DeepSeek | 685B MoE | 64K | $0.55 | ★★★★☆ | o1 수준 추론, 수학·코드 특화 | ✅ |
|
|
518
|
+
| mistral-large-2 | Mistral AI | ~123B | 128K | $2.00 | ★★★★☆ | 유럽 GDPR 완전 준수, 함수 호출 강화 | ✅ |
|
|
519
|
+
| mistral-small-3 | Mistral AI | ~22B | 128K | $0.10 | ★★★☆☆ | 저비용 고속, Apache 2.0 오픈소스 | ✅ |
|
|
520
|
+
| Qwen-2.5-72B-Instruct | Alibaba | 72B | 128K | $0.40 | ★★★★★ | 중국어·한국어 최강, 수학·코드 특화 | ✅ |
|
|
521
|
+
| Qwen-2.5-Coder-32B | Alibaba | 32B | 128K | $0.20 | ★★★★☆ | 코드 특화, GPT-4o 대비 코딩 성능 우위 | ✅ |
|
|
522
|
+
| Command R+ | Cohere | ~104B | 128K | $2.50 | ★★★☆☆ | RAG·검색 증강 특화, 기업용 엔터프라이즈 | ⚠️ driver 직접 구현 필요 |
|
|
523
|
+
| sonar-pro | Perplexity | 비공개 | 127K | $3.00 + 검색비 | ★★★★☆ | 실시간 웹 검색 자동 통합 | ✅ |
|
|
524
|
+
| DBRX-Instruct | Databricks | 132B MoE | 32K | $0.60 | ★★☆☆☆ | 엔터프라이즈 데이터·파인튜닝 특화 | ✅ |
|
|
525
|
+
| Mixtral-8x22B-Instruct | Mistral AI | 141B MoE | 64K | $0.90 | ★★★☆☆ | 고품질 MoE, 다국어 효율적 | ✅ |
|
|
526
|
+
|
|
527
|
+
---
|
|
528
|
+
|
|
529
|
+
### 한국어 특화 모델
|
|
530
|
+
|
|
531
|
+
| 모델 | 제공사 | 파라미터 | 컨텍스트 | 한글 지원 | 특징 | 연동 방법 | 연동 가능 |
|
|
532
|
+
| -------------------------- | -------------- | -------- | -------- | --------- | --------------------------------------- | ---------------------------- | :------------: |
|
|
533
|
+
| EXAONE-3.5-7.8B-Instruct | LG AI Research | 7.8B | 32K | ★★★★★ | 한국어 최강 오픈소스, Apache 2.0 | Ollama, vLLM, llama.cpp | 🔶 |
|
|
534
|
+
| EXAONE-3.5-32B-Instruct | LG AI Research | 32B | 32K | ★★★★★ | 대형 한국어 모델, GPT-4급 한글 품질 | vLLM, Together AI (일부) | 🔶 |
|
|
535
|
+
| HyperCLOVA X | NAVER | 비공개 | 비공개 | ★★★★★ | 한국 문화·법률·비즈니스 최적화 | CLOVA Studio API (별도 계약) | ⚠️ 별도 driver |
|
|
536
|
+
| SOLAR-10.7B-Instruct | Upstage | 11B | 4K | ★★★★☆ | 한국어 특화 파인튜닝, 상용 가능 | Together AI, Ollama | ✅ |
|
|
537
|
+
| Qwen-2.5-7B-Instruct | Alibaba | 7B | 128K | ★★★★★ | 한국어 포함 다국어 우수, 로컬 실행 용이 | Ollama, vLLM | 🔶 |
|
|
538
|
+
| Llama-3-Korean-Bllossom-8B | Bllossom | 8B | 8K | ★★★★☆ | Llama-3 한국어 파인튜닝, 무료 오픈소스 | Ollama, llama.cpp | 🔶 |
|
|
539
|
+
| Ko-Gemma-2-9B | Community | 9B | 8K | ★★★★☆ | Gemma-2 한국어 파인튜닝 | Ollama, vLLM | 🔶 |
|
|
540
|
+
| Kanana-1.5-8B-Instruct | Kakao | 8B | 32K | ★★★★★ | 카카오 한국어 특화, Apache 2.0 오픈소스 | Ollama, vLLM | 🔶 |
|
|
541
|
+
|
|
542
|
+
> **로컬 모델 연동 방법**: 🔶 표시 모델은 Ollama(`ollama pull <모델명>`) 또는 vLLM으로 서빙 후 해당 driver로 연결합니다.
|
|
543
|
+
> **별도 driver 필요** 모델은 현재 플러그인에서 직접 지원하지 않으며, OpenAI 호환 API를 제공하는 경우 `openai` driver + `base_url` 지정으로 우회 연동이 가능합니다.
|
|
544
|
+
|
|
545
|
+
---
|
|
546
|
+
|
|
547
|
+
## API 레퍼런스
|
|
548
|
+
|
|
549
|
+
라우트별 파라미터 표, 요청/응답 예제, 상태코드는 [LLM Routes](../routes/llm-routes.md) 문서를 참고하세요.
|
|
550
|
+
|
|
551
|
+
---
|
|
552
|
+
|
|
553
|
+
## 운영 팁
|
|
554
|
+
|
|
555
|
+
- Ollama는 로컬/사내 서버에서 **무료**로 사용 가능 — 보안 민감 데이터 처리에 적합
|
|
556
|
+
- `cache.enabled: true`로 동일 요청에 대한 비용 절감 가능
|
|
557
|
+
- `json_mode: true`는 OpenAI/Anthropic 모두 지원하나 Ollama는 모델 의존적
|
|
558
|
+
- 스트리밍 응답 시 클라이언트는 `EventSource` 또는 `fetch + ReadableStream` 사용
|
|
559
|
+
|
|
560
|
+
---
|
|
561
|
+
|
|
562
|
+
## 관련 문서
|
|
563
|
+
|
|
564
|
+
- [LLM Routes](../routes/llm-routes.md)
|
|
565
|
+
- [설정 예제](../../src/app/plugins/llm/config.example.json)
|
|
566
|
+
- [프롬프트 템플릿](../../templates/llm/prompts/)
|
|
567
|
+
- [Entity Server LLM 가이드](../../../docs/plugins/llm-guide.md)
|