npm - inference-server - Versions diffs - 1.0.0-beta.19 - Mend

inference-server 1.0.0-beta.19

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (227) hide show

package/README.md +216 -0
package/dist/api/openai/enums.d.ts +4 -0
package/dist/api/openai/enums.js +17 -0
package/dist/api/openai/enums.js.map +1 -0
package/dist/api/openai/handlers/chat.d.ts +3 -0
package/dist/api/openai/handlers/chat.js +358 -0
package/dist/api/openai/handlers/chat.js.map +1 -0
package/dist/api/openai/handlers/completions.d.ts +3 -0
package/dist/api/openai/handlers/completions.js +169 -0
package/dist/api/openai/handlers/completions.js.map +1 -0
package/dist/api/openai/handlers/embeddings.d.ts +3 -0
package/dist/api/openai/handlers/embeddings.js +74 -0
package/dist/api/openai/handlers/embeddings.js.map +1 -0
package/dist/api/openai/handlers/images.d.ts +0 -0
package/dist/api/openai/handlers/images.js +4 -0
package/dist/api/openai/handlers/images.js.map +1 -0
package/dist/api/openai/handlers/models.d.ts +3 -0
package/dist/api/openai/handlers/models.js +23 -0
package/dist/api/openai/handlers/models.js.map +1 -0
package/dist/api/openai/handlers/transcription.d.ts +0 -0
package/dist/api/openai/handlers/transcription.js +4 -0
package/dist/api/openai/handlers/transcription.js.map +1 -0
package/dist/api/openai/index.d.ts +7 -0
package/dist/api/openai/index.js +14 -0
package/dist/api/openai/index.js.map +1 -0
package/dist/api/parseJSONRequestBody.d.ts +2 -0
package/dist/api/parseJSONRequestBody.js +24 -0
package/dist/api/parseJSONRequestBody.js.map +1 -0
package/dist/api/v1/index.d.ts +2 -0
package/dist/api/v1/index.js +29 -0
package/dist/api/v1/index.js.map +1 -0
package/dist/cli.d.ts +1 -0
package/dist/cli.js +10 -0
package/dist/cli.js.map +1 -0
package/dist/engines/gpt4all/engine.d.ts +34 -0
package/dist/engines/gpt4all/engine.js +357 -0
package/dist/engines/gpt4all/engine.js.map +1 -0
package/dist/engines/gpt4all/util.d.ts +3 -0
package/dist/engines/gpt4all/util.js +29 -0
package/dist/engines/gpt4all/util.js.map +1 -0
package/dist/engines/index.d.ts +19 -0
package/dist/engines/index.js +21 -0
package/dist/engines/index.js.map +1 -0
package/dist/engines/node-llama-cpp/engine.d.ts +49 -0
package/dist/engines/node-llama-cpp/engine.js +666 -0
package/dist/engines/node-llama-cpp/engine.js.map +1 -0
package/dist/engines/node-llama-cpp/types.d.ts +13 -0
package/dist/engines/node-llama-cpp/types.js +2 -0
package/dist/engines/node-llama-cpp/types.js.map +1 -0
package/dist/engines/node-llama-cpp/util.d.ts +15 -0
package/dist/engines/node-llama-cpp/util.js +84 -0
package/dist/engines/node-llama-cpp/util.js.map +1 -0
package/dist/engines/node-llama-cpp/validateModelFile.d.ts +8 -0
package/dist/engines/node-llama-cpp/validateModelFile.js +36 -0
package/dist/engines/node-llama-cpp/validateModelFile.js.map +1 -0
package/dist/engines/stable-diffusion-cpp/engine.d.ts +90 -0
package/dist/engines/stable-diffusion-cpp/engine.js +294 -0
package/dist/engines/stable-diffusion-cpp/engine.js.map +1 -0
package/dist/engines/stable-diffusion-cpp/types.d.ts +3 -0
package/dist/engines/stable-diffusion-cpp/types.js +2 -0
package/dist/engines/stable-diffusion-cpp/types.js.map +1 -0
package/dist/engines/stable-diffusion-cpp/util.d.ts +4 -0
package/dist/engines/stable-diffusion-cpp/util.js +55 -0
package/dist/engines/stable-diffusion-cpp/util.js.map +1 -0
package/dist/engines/stable-diffusion-cpp/validateModelFiles.d.ts +19 -0
package/dist/engines/stable-diffusion-cpp/validateModelFiles.js +91 -0
package/dist/engines/stable-diffusion-cpp/validateModelFiles.js.map +1 -0
package/dist/engines/transformers-js/engine.d.ts +37 -0
package/dist/engines/transformers-js/engine.js +538 -0
package/dist/engines/transformers-js/engine.js.map +1 -0
package/dist/engines/transformers-js/types.d.ts +7 -0
package/dist/engines/transformers-js/types.js +2 -0
package/dist/engines/transformers-js/types.js.map +1 -0
package/dist/engines/transformers-js/util.d.ts +7 -0
package/dist/engines/transformers-js/util.js +36 -0
package/dist/engines/transformers-js/util.js.map +1 -0
package/dist/engines/transformers-js/validateModelFiles.d.ts +17 -0
package/dist/engines/transformers-js/validateModelFiles.js +133 -0
package/dist/engines/transformers-js/validateModelFiles.js.map +1 -0
package/dist/experiments/ChatWithVision.d.ts +11 -0
package/dist/experiments/ChatWithVision.js +91 -0
package/dist/experiments/ChatWithVision.js.map +1 -0
package/dist/experiments/StableDiffPromptGenerator.d.ts +0 -0
package/dist/experiments/StableDiffPromptGenerator.js +4 -0
package/dist/experiments/StableDiffPromptGenerator.js.map +1 -0
package/dist/experiments/VoiceFunctionCall.d.ts +18 -0
package/dist/experiments/VoiceFunctionCall.js +51 -0
package/dist/experiments/VoiceFunctionCall.js.map +1 -0
package/dist/http.d.ts +19 -0
package/dist/http.js +54 -0
package/dist/http.js.map +1 -0
package/dist/index.d.ts +7 -0
package/dist/index.js +8 -0
package/dist/index.js.map +1 -0
package/dist/instance.d.ts +88 -0
package/dist/instance.js +594 -0
package/dist/instance.js.map +1 -0
package/dist/lib/acquireFileLock.d.ts +7 -0
package/dist/lib/acquireFileLock.js +38 -0
package/dist/lib/acquireFileLock.js.map +1 -0
package/dist/lib/calculateContextIdentity.d.ts +7 -0
package/dist/lib/calculateContextIdentity.js +39 -0
package/dist/lib/calculateContextIdentity.js.map +1 -0
package/dist/lib/calculateFileChecksum.d.ts +1 -0
package/dist/lib/calculateFileChecksum.js +16 -0
package/dist/lib/calculateFileChecksum.js.map +1 -0
package/dist/lib/copyDirectory.d.ts +6 -0
package/dist/lib/copyDirectory.js +27 -0
package/dist/lib/copyDirectory.js.map +1 -0
package/dist/lib/decodeAudio.d.ts +1 -0
package/dist/lib/decodeAudio.js +26 -0
package/dist/lib/decodeAudio.js.map +1 -0
package/dist/lib/downloadModelFile.d.ts +10 -0
package/dist/lib/downloadModelFile.js +58 -0
package/dist/lib/downloadModelFile.js.map +1 -0
package/dist/lib/flattenMessageTextContent.d.ts +2 -0
package/dist/lib/flattenMessageTextContent.js +11 -0
package/dist/lib/flattenMessageTextContent.js.map +1 -0
package/dist/lib/getCacheDirPath.d.ts +12 -0
package/dist/lib/getCacheDirPath.js +31 -0
package/dist/lib/getCacheDirPath.js.map +1 -0
package/dist/lib/loadImage.d.ts +12 -0
package/dist/lib/loadImage.js +30 -0
package/dist/lib/loadImage.js.map +1 -0
package/dist/lib/logger.d.ts +12 -0
package/dist/lib/logger.js +98 -0
package/dist/lib/logger.js.map +1 -0
package/dist/lib/math.d.ts +7 -0
package/dist/lib/math.js +30 -0
package/dist/lib/math.js.map +1 -0
package/dist/lib/resolveModelFileLocation.d.ts +15 -0
package/dist/lib/resolveModelFileLocation.js +41 -0
package/dist/lib/resolveModelFileLocation.js.map +1 -0
package/dist/lib/util.d.ts +7 -0
package/dist/lib/util.js +61 -0
package/dist/lib/util.js.map +1 -0
package/dist/lib/validateModelFile.d.ts +9 -0
package/dist/lib/validateModelFile.js +62 -0
package/dist/lib/validateModelFile.js.map +1 -0
package/dist/lib/validateModelOptions.d.ts +3 -0
package/dist/lib/validateModelOptions.js +23 -0
package/dist/lib/validateModelOptions.js.map +1 -0
package/dist/pool.d.ts +61 -0
package/dist/pool.js +512 -0
package/dist/pool.js.map +1 -0
package/dist/server.d.ts +59 -0
package/dist/server.js +221 -0
package/dist/server.js.map +1 -0
package/dist/standalone.d.ts +1 -0
package/dist/standalone.js +306 -0
package/dist/standalone.js.map +1 -0
package/dist/store.d.ts +60 -0
package/dist/store.js +203 -0
package/dist/store.js.map +1 -0
package/dist/types/completions.d.ts +57 -0
package/dist/types/completions.js +2 -0
package/dist/types/completions.js.map +1 -0
package/dist/types/index.d.ts +326 -0
package/dist/types/index.js +2 -0
package/dist/types/index.js.map +1 -0
package/docs/engines.md +28 -0
package/docs/gpu.md +72 -0
package/docs/http-api.md +147 -0
package/examples/all-options.js +108 -0
package/examples/chat-cli.js +56 -0
package/examples/chat-server.js +65 -0
package/examples/concurrency.js +70 -0
package/examples/express.js +70 -0
package/examples/pool.js +91 -0
package/package.json +113 -0
package/src/api/openai/enums.ts +20 -0
package/src/api/openai/handlers/chat.ts +408 -0
package/src/api/openai/handlers/completions.ts +196 -0
package/src/api/openai/handlers/embeddings.ts +92 -0
package/src/api/openai/handlers/images.ts +3 -0
package/src/api/openai/handlers/models.ts +33 -0
package/src/api/openai/handlers/transcription.ts +2 -0
package/src/api/openai/index.ts +16 -0
package/src/api/parseJSONRequestBody.ts +26 -0
package/src/api/v1/DRAFT.md +16 -0
package/src/api/v1/index.ts +37 -0
package/src/cli.ts +9 -0
package/src/engines/gpt4all/engine.ts +441 -0
package/src/engines/gpt4all/util.ts +31 -0
package/src/engines/index.ts +28 -0
package/src/engines/node-llama-cpp/engine.ts +811 -0
package/src/engines/node-llama-cpp/types.ts +17 -0
package/src/engines/node-llama-cpp/util.ts +126 -0
package/src/engines/node-llama-cpp/validateModelFile.ts +46 -0
package/src/engines/stable-diffusion-cpp/engine.ts +369 -0
package/src/engines/stable-diffusion-cpp/types.ts +54 -0
package/src/engines/stable-diffusion-cpp/util.ts +58 -0
package/src/engines/stable-diffusion-cpp/validateModelFiles.ts +119 -0
package/src/engines/transformers-js/engine.ts +659 -0
package/src/engines/transformers-js/types.ts +25 -0
package/src/engines/transformers-js/util.ts +40 -0
package/src/engines/transformers-js/validateModelFiles.ts +168 -0
package/src/experiments/ChatWithVision.ts +103 -0
package/src/experiments/StableDiffPromptGenerator.ts +2 -0
package/src/experiments/VoiceFunctionCall.ts +71 -0
package/src/http.ts +72 -0
package/src/index.ts +7 -0
package/src/instance.ts +723 -0
package/src/lib/acquireFileLock.ts +38 -0
package/src/lib/calculateContextIdentity.ts +53 -0
package/src/lib/calculateFileChecksum.ts +18 -0
package/src/lib/copyDirectory.ts +29 -0
package/src/lib/decodeAudio.ts +39 -0
package/src/lib/downloadModelFile.ts +70 -0
package/src/lib/flattenMessageTextContent.ts +19 -0
package/src/lib/getCacheDirPath.ts +34 -0
package/src/lib/loadImage.ts +46 -0
package/src/lib/logger.ts +112 -0
package/src/lib/math.ts +31 -0
package/src/lib/resolveModelFileLocation.ts +49 -0
package/src/lib/util.ts +75 -0
package/src/lib/validateModelFile.ts +71 -0
package/src/lib/validateModelOptions.ts +31 -0
package/src/pool.ts +651 -0
package/src/server.ts +270 -0
package/src/standalone.ts +320 -0
package/src/store.ts +278 -0
package/src/types/completions.ts +86 -0
package/src/types/index.ts +488 -0
package/tsconfig.json +29 -0
package/tsconfig.release.json +11 -0
package/vitest.config.ts +18 -0

package/src/api/openai/handlers/completions.ts ADDED Viewed

@@ -0,0 +1,196 @@
+import type { IncomingMessage, ServerResponse } from 'node:http'
+import type { OpenAI } from 'openai'
+import type { ModelServer } from '#package/server.js'
+import { TextCompletionRequest } from '#package/types/index.js'
+import { parseJSONRequestBody } from '#package/api/parseJSONRequestBody.js'
+import { omitEmptyValues } from '#package/lib/util.js'
+import { finishReasonMap } from '../enums.js'
+interface OpenAICompletionParams
+	extends Omit<OpenAI.CompletionCreateParamsStreaming, 'stream'> {
+	stream?: boolean
+	top_k?: number
+	min_p?: number
+	repeat_penalty_num?: number
+}
+interface OpenAICompletionChunk extends OpenAI.Completions.Completion {
+	usage?: OpenAI.CompletionUsage
+}
+// v1/completions
+// https://platform.openai.com/docs/api-reference/completions/create
+export function createCompletionHandler(modelServer: ModelServer) {
+	return async (req: IncomingMessage, res: ServerResponse) => {
+		let args: OpenAICompletionParams
+		try {
+			const body = await parseJSONRequestBody(req)
+			args = body
+		} catch (e) {
+			console.error(e)
+			res.writeHead(400, { 'Content-Type': 'application/json' })
+			res.end(JSON.stringify({ error: 'Invalid request' }))
+			return
+		}
+		// TODO ajv schema validation?
+		if (!args.model || !args.prompt) {
+			res.writeHead(400, { 'Content-Type': 'application/json' })
+			res.end(JSON.stringify({ error: 'Invalid request' }))
+			return
+		}
+		if (!modelServer.modelExists(args.model)) {
+			res.writeHead(400, { 'Content-Type': 'application/json' })
+			res.end(JSON.stringify({ error: 'Invalid model' }))
+			return
+		}
+		const controller = new AbortController()
+		req.on('close', () => {
+			console.debug('Client closed connection')
+			controller.abort()
+		})
+		req.on('end', () => {
+			console.debug('Client ended connection')
+			controller.abort()
+		})
+		try {
+			if (args.stream) {
+				res.writeHead(200, {
+					'Content-Type': 'text/event-stream',
+					'Cache-Control': 'no-cache',
+					Connection: 'keep-alive',
+				})
+				res.flushHeaders()
+			}
+			let prompt = args.prompt
+			if (typeof prompt !== 'string') {
+				throw new Error('Prompt must be a string')
+			}
+			let stop = args.stop ? args.stop : undefined
+			if (typeof stop === 'string') {
+				stop = [stop]
+			}
+			const completionReq = omitEmptyValues<TextCompletionRequest>({
+				model: args.model,
+				prompt: args.prompt as string,
+				temperature: args.temperature ? args.temperature : undefined,
+				stream: args.stream ? Boolean(args.stream) : false,
+				maxTokens: args.max_tokens ? args.max_tokens : undefined,
+				seed: args.seed ? args.seed : undefined,
+				stop,
+				frequencyPenalty: args.frequency_penalty
+					? args.frequency_penalty
+					: undefined,
+				presencePenalty: args.presence_penalty
+					? args.presence_penalty
+					: undefined,
+				tokenBias: args.logit_bias ? args.logit_bias : undefined,
+				topP: args.top_p ? args.top_p : undefined,
+				// additional non-spec params
+				repeatPenaltyNum: args.repeat_penalty_num
+					? args.repeat_penalty_num
+					: undefined,
+				minP: args.min_p ? args.min_p : undefined,
+				topK: args.top_k ? args.top_k : undefined,
+			})
+			const { instance, release } = await modelServer.requestInstance(
+				completionReq,
+				controller.signal,
+			)
+			const task = instance.processTextCompletionTask(completionReq, {
+				signal: controller.signal,
+				onChunk: (chunk) => {
+					if (args.stream) {
+						const chunkData: OpenAICompletionChunk = {
+							id: task.id,
+							model: task.model,
+							object: 'text_completion',
+							created: Math.floor(task.createdAt.getTime() / 1000),
+							choices: [
+								{
+									index: 0,
+									text: chunk.text,
+									logprobs: null,
+									// @ts-ignore official api returns null here in the same case
+									finish_reason: null,
+								},
+							],
+						}
+						res.write(`data: ${JSON.stringify(chunkData)}\n\n`)
+					}
+				},
+			})
+			const result = await task.result
+			release()
+			if (args.stream) {
+				if (args.stream_options?.include_usage) {
+					const finalChunk: OpenAICompletionChunk = {
+						id: task.id,
+						model: task.model,
+						object: 'text_completion',
+						created: Math.floor(task.createdAt.getTime() / 1000),
+						choices: [
+							{
+								index: 0,
+								text: '',
+								logprobs: null,
+								// @ts-ignore
+								finish_reason: result.finishReason
+									? finishReasonMap[result.finishReason]
+									: 'stop',
+							},
+						],
+					}
+					res.write(
+						`data: ${JSON.stringify(finalChunk)}\n\n`,
+					)
+				}
+				res.write('data: [DONE]')
+				res.end()
+			} else {
+				const response: OpenAI.Completions.Completion = {
+					id: task.id,
+					model: task.model,
+					object: 'text_completion',
+					created: Math.floor(task.createdAt.getTime() / 1000),
+					system_fingerprint: instance.fingerprint,
+					choices: [
+						{
+							index: 0,
+							text: result.text,
+							logprobs: null,
+							// @ts-ignore
+							finish_reason: result.finishReason
+								? finishReasonMap[result.finishReason]
+								: 'stop',
+						},
+					],
+					usage: {
+						prompt_tokens: result.promptTokens,
+						completion_tokens: result.completionTokens,
+						total_tokens: result.contextTokens,
+					},
+				}
+				res.writeHead(200, { 'Content-Type': 'application/json' })
+				res.end(JSON.stringify(response, null, 2))
+			}
+		} catch (err) {
+			console.error(err)
+			if (args.stream) {
+				res.write('data: [ERROR]')
+			} else {
+				res.writeHead(500, { 'Content-Type': 'application/json' })
+				res.end(JSON.stringify({ error: 'Internal server error' }))
+			}
+		}
+	}
+}

package/src/api/openai/handlers/embeddings.ts ADDED Viewed

@@ -0,0 +1,92 @@
+import { IncomingMessage, ServerResponse } from 'node:http'
+import type { OpenAI } from 'openai'
+import { EmbeddingRequest } from '#package/types/index.js'
+import { parseJSONRequestBody } from '#package/api/parseJSONRequestBody.js'
+import { omitEmptyValues } from '#package/lib/util.js'
+import { ModelServer } from '#package/server.js'
+type OpenAIEmbeddingsParams = OpenAI.EmbeddingCreateParams
+// v1/embeddings
+// https://platform.openai.com/docs/api-reference/embeddings
+export function createEmbeddingsHandler(modelServer: ModelServer) {
+	return async (req: IncomingMessage, res: ServerResponse) => {
+		let args: OpenAIEmbeddingsParams
+		try {
+			const body = await parseJSONRequestBody(req)
+			args = body
+		} catch (e) {
+			console.error(e)
+			res.writeHead(400, { 'Content-Type': 'application/json' })
+			res.end(JSON.stringify({ error: 'Invalid request' }))
+			return
+		}
+		// TODO ajv schema validation?
+		if (!args.model || !args.input) {
+			res.writeHead(400, { 'Content-Type': 'application/json' })
+			res.end(JSON.stringify({ error: 'Invalid request' }))
+			return
+		}
+		if (!modelServer.modelExists(args.model)) {
+			res.writeHead(400, { 'Content-Type': 'application/json' })
+			res.end(JSON.stringify({ error: 'Invalid model' }))
+			return
+		}
+		const controller = new AbortController()
+		req.on('close', () => {
+			console.debug('Client closed connection')
+			controller.abort()
+		})
+		req.on('end', () => {
+			console.debug('Client ended connection')
+			controller.abort()
+		})
+		try {
+			let input = args.input
+			if (typeof input !== 'string') {
+				throw new Error('Input must be a string')
+			}
+			const embeddingsReq = omitEmptyValues<EmbeddingRequest>({
+				model: args.model,
+				input: args.input as string,
+			})
+			const { instance, release } = await modelServer.requestInstance(
+				embeddingsReq,
+				controller.signal,
+			)
+			const task = instance.processEmbeddingTask(embeddingsReq)
+			const result = await task.result
+			release()
+			const response: OpenAI.CreateEmbeddingResponse = {
+				model: instance.modelId,
+				object: 'list',
+				data: result.embeddings.map((embedding, index) => ({
+					embedding: Array.from(embedding),
+					index,
+					object: 'embedding',
+				})),
+				usage: {
+					prompt_tokens: result.inputTokens,
+					total_tokens: result.inputTokens,
+				},
+			}
+			res.writeHead(200, { 'Content-Type': 'application/json' })
+			res.end(JSON.stringify(response, null, 2))
+		} catch (err) {
+			console.error(err)
+			res.writeHead(500, { 'Content-Type': 'application/json' })
+			res.end(JSON.stringify({ error: 'Internal server error' }))
+		}
+	}
+}

package/src/api/openai/handlers/images.ts ADDED Viewed

@@ -0,0 +1,3 @@
+// v1/images endpoints
+// https://platform.openai.com/docs/api-reference/images/create

package/src/api/openai/handlers/models.ts ADDED Viewed

@@ -0,0 +1,33 @@
+import type { IncomingMessage, ServerResponse } from 'node:http'
+import path from 'node:path'
+import type { OpenAI } from 'openai'
+import type { ModelServer } from '#package/server'
+// https://platform.openai.com/docs/api-reference/models/list
+export function createModelsHandler(modelServer: ModelServer) {
+	return async (req: IncomingMessage, res: ServerResponse) => {
+		const models = modelServer.store.getStatus()
+		const data: OpenAI.Model[] = Object.entries(models).map(
+			([id, info]) => {
+				// const lastModDate = new Date(info.source.lastModified)
+				// const created = Math.floor(lastModDate.getTime() / 1000)
+				// const dirPath = path.dirname(info.source.file);
+				// const lastDir = path.basename(dirPath);
+				// const baseName = path.basename(info.source.file);
+				const owned_by = info.engine// + ':' + path.join(lastDir, baseName);
+				return {
+					object: 'model',
+					id,
+					created: 0,
+					owned_by,
+				}
+			},
+		)
+		res.writeHead(200, { 'Content-Type': 'application/json' })
+		res.end(JSON.stringify({ object: 'list', data }, null, 2))
+	}
+}

package/src/api/openai/handlers/transcription.ts ADDED Viewed

	@@ -0,0 +1,2 @@
1	+ // TODO
2	+ // https://platform.openai.com/docs/api-reference/audio/createTranscription

package/src/api/openai/index.ts ADDED Viewed

@@ -0,0 +1,16 @@
+import type { ModelServer } from '#package/server.js'
+import { createChatCompletionHandler } from './handlers/chat.js'
+import { createCompletionHandler } from './handlers/completions.js'
+import { createModelsHandler } from './handlers/models.js'
+import { createEmbeddingsHandler } from './handlers/embeddings.js'
+// See OpenAI API specs at https://github.com/openai/openai-openapi/blob/master/openapi.yaml
+export function createOpenAIRequestHandlers(modelServer: ModelServer) {
+	return {
+		chatCompletions: createChatCompletionHandler(modelServer),
+		completions: createCompletionHandler(modelServer),
+		models: createModelsHandler(modelServer),
+		embeddings: createEmbeddingsHandler(modelServer),
+	}
+}

package/src/api/parseJSONRequestBody.ts ADDED Viewed

@@ -0,0 +1,26 @@
+import { IncomingMessage } from 'node:http'
+export function parseJSONRequestBody(req: IncomingMessage | Request): Promise<any> {
+	return new Promise((resolve, reject) => {
+		// if request is from express theres no need to parse anything
+		if ('body' in req) {
+			resolve(req.body)
+			return
+		}
+		// for native http server
+		let body = ''
+		req.on('data', (chunk) => {
+			body += chunk.toString()
+		})
+		req.on('end', () => {
+			try {
+				const data = JSON.parse(body)
+				resolve(data)
+			} catch (error) {
+				reject(error)
+			}
+		})
+	})
+}

package/src/api/v1/DRAFT.md ADDED Viewed

@@ -0,0 +1,16 @@
+See [discussion](https://github.com/iimez/inference-server/discussions/8) for more details.
+### Task API
+- `POST /tasks/text-completion`
+- `POST /tasks/chat-completion` should continue to be stateless
+- `GET /tasks/{task_id}`
+- `DELETE /tasks/{task_id}`
+### Thread API
+- `POST /threads`
+- `POST /threads/{thread_id}` mutate state without generating anything
+- `POST /threads/{thread_id}/generate` to generate a new assistant message
+- `GET /threads/{thread_id}`
+- `DELETE /threads/{thread_id}`

package/src/api/v1/index.ts ADDED Viewed

@@ -0,0 +1,37 @@
+import { IncomingMessage, ServerResponse } from 'node:http'
+import express from 'express'
+import { ModelPool } from '#package/pool.js'
+import { ModelServer } from '#package/server.js'
+export function createAPIMiddleware(server: ModelServer) {
+	const router = express.Router()
+	router.use((req, res, next) => {
+		console.debug('API call', {
+			method: req.method,
+			url: req.url,
+			body: req.body,
+		})
+		next()
+	})
+	return router
+	// return async (req: IncomingMessage, res: ServerResponse) => {
+	// 	let args: any
+	// 	try {
+	// 		const body = await parseJSONRequestBody(req)
+	// 		args = body
+	// 	} catch (e) {
+	// 		console.error(e)
+	// 		res.writeHead(400, { 'Content-Type': 'application/json' })
+	// 		res.end(JSON.stringify({ error: 'Invalid request' }))
+	// 		return
+	// 	}
+	// 	console.debug('Handler', JSON.stringify(args, null, 2))
+	// 	res.writeHead(200, { 'Content-Type': 'application/json' })
+	// 	res.end(JSON.stringify({ message: 'Hello' }))
+	// }
+}

package/src/cli.ts ADDED Viewed

@@ -0,0 +1,9 @@
+#!/usr/bin/env node
+process.stdout.write("Nothing here, yet.\n");
+/* API Ideas:
+- `infsrv ls` - list stored models
+- `infsrv rm <name>` - remove a stored model
+- `infsrv show <name>` - show details of a stored model
+- `infsrv prepare <config>` - download everything required for given config
+*/