feat: [wip] chat completions

ericc-ch · ericc-ch · commit a5c14e897d4b · 2025-01-12T15:58:04.000+07:00
diff --git a/docs/api/completions.txt b/docs/api/completions.txt
diff --git a/docs/api/models.txt b/docs/api/models.txt
@@ -0,0 +1,5 @@
+GET https://api.individual.githubcopilot.com/models HTTP/2.0
+authorization: 
+copilot-integration-id: vscode-chat
+
+{"data":[{"capabilities":{"family":"gpt-3.5-turbo","limits":{"max_context_window_tokens":16384,"max_output_tokens":4096,"max_prompt_tokens":12288},"object":"model_capabilities","supports":{"tool_calls":true},"tokenizer":"cl100k_base","type":"chat"},"id":"gpt-3.5-turbo","model_picker_enabled":false,"name":"GPT 3.5 Turbo","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-3.5-turbo-0613"},{"capabilities":{"family":"gpt-3.5-turbo","limits":{"max_context_window_tokens":16384,"max_output_tokens":4096,"max_prompt_tokens":12288},"object":"model_capabilities","supports":{"tool_calls":true},"tokenizer":"cl100k_base","type":"chat"},"id":"gpt-3.5-turbo-0613","model_picker_enabled":false,"name":"GPT 3.5 Turbo","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-3.5-turbo-0613"},{"capabilities":{"family":"gpt-4","limits":{"max_context_window_tokens":32768,"max_output_tokens":4096,"max_prompt_tokens":32768},"object":"model_capabilities","supports":{"tool_calls":true},"tokenizer":"cl100k_base","type":"chat"},"id":"gpt-4","model_picker_enabled":false,"name":"GPT 4","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4-0613"},{"capabilities":{"family":"gpt-4","limits":{"max_context_window_tokens":32768,"max_output_tokens":4096,"max_prompt_tokens":32768},"object":"model_capabilities","supports":{"tool_calls":true},"tokenizer":"cl100k_base","type":"chat"},"id":"gpt-4-0613","model_picker_enabled":false,"name":"GPT 4","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4-0613"},{"capabilities":{"family":"gpt-4o","limits":{"max_context_window_tokens":128000,"max_output_tokens":4096,"max_prompt_tokens":64000},"object":"model_capabilities","supports":{"parallel_tool_calls":true,"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"gpt-4o","model_picker_enabled":true,"name":"GPT 4o","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4o-2024-05-13"},{"capabilities":{"family":"gpt-4o","limits":{"max_context_window_tokens":128000,"max_output_tokens":4096,"max_prompt_tokens":64000},"object":"model_capabilities","supports":{"parallel_tool_calls":true,"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"gpt-4o-2024-05-13","model_picker_enabled":false,"name":"GPT 4o","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4o-2024-05-13"},{"capabilities":{"family":"gpt-4o","limits":{"max_context_window_tokens":128000,"max_output_tokens":4096,"max_prompt_tokens":64000},"object":"model_capabilities","supports":{"parallel_tool_calls":true,"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"gpt-4-o-preview","model_picker_enabled":false,"name":"GPT 4o","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4o-2024-05-13"},{"capabilities":{"family":"gpt-4o","limits":{"max_context_window_tokens":128000,"max_output_tokens":16384,"max_prompt_tokens":64000},"object":"model_capabilities","supports":{"parallel_tool_calls":true,"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"gpt-4o-2024-08-06","model_picker_enabled":false,"name":"GPT 4o","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4o-2024-08-06"},{"capabilities":{"family":"text-embedding-ada-002","limits":{"max_inputs":256},"object":"model_capabilities","supports":{},"tokenizer":"cl100k_base","type":"embeddings"},"id":"text-embedding-ada-002","model_picker_enabled":false,"name":"Embedding V2 Ada","object":"model","preview":false,"vendor":"Azure OpenAI","version":"text-embedding-ada-002"},{"capabilities":{"family":"text-embedding-3-small","limits":{"max_inputs":512},"object":"model_capabilities","supports":{"dimensions":true},"tokenizer":"cl100k_base","type":"embeddings"},"id":"text-embedding-3-small","model_picker_enabled":false,"name":"Embedding V3 small","object":"model","preview":false,"vendor":"Azure OpenAI","version":"text-embedding-3-small"},{"capabilities":{"family":"text-embedding-3-small","object":"model_capabilities","supports":{"dimensions":true},"tokenizer":"cl100k_base","type":"embeddings"},"id":"text-embedding-3-small-inference","model_picker_enabled":false,"name":"Embedding V3 small (Inference)","object":"model","preview":false,"vendor":"Azure OpenAI","version":"text-embedding-3-small"},{"capabilities":{"family":"gpt-4o-mini","limits":{"max_context_window_tokens":128000,"max_output_tokens":4096,"max_prompt_tokens":12288},"object":"model_capabilities","supports":{"parallel_tool_calls":true,"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"gpt-4o-mini","model_picker_enabled":false,"name":"GPT 4o Mini","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4o-mini-2024-07-18"},{"capabilities":{"family":"gpt-4o-mini","limits":{"max_context_window_tokens":128000,"max_output_tokens":4096,"max_prompt_tokens":12288},"object":"model_capabilities","supports":{"parallel_tool_calls":true,"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"gpt-4o-mini-2024-07-18","model_picker_enabled":false,"name":"GPT 4o Mini","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4o-mini-2024-07-18"},{"capabilities":{"family":"gpt-4-turbo","limits":{"max_context_window_tokens":128000,"max_output_tokens":4096,"max_prompt_tokens":64000},"object":"model_capabilities","supports":{"parallel_tool_calls":true,"tool_calls":true},"tokenizer":"cl100k_base","type":"chat"},"id":"gpt-4-0125-preview","model_picker_enabled":false,"name":"GPT 4 Turbo","object":"model","preview":false,"vendor":"Azure OpenAI","version":"gpt-4-0125-preview"},{"capabilities":{"family":"o1-mini","limits":{"max_context_window_tokens":128000,"max_prompt_tokens":20000},"object":"model_capabilities","supports":{},"tokenizer":"o200k_base","type":"chat"},"id":"o1-mini","model_picker_enabled":true,"name":"o1-mini (Preview)","object":"model","preview":true,"vendor":"Azure OpenAI","version":"o1-mini-2024-09-12"},{"capabilities":{"family":"o1-mini","limits":{"max_context_window_tokens":128000,"max_prompt_tokens":20000},"object":"model_capabilities","supports":{},"tokenizer":"o200k_base","type":"chat"},"id":"o1-mini-2024-09-12","model_picker_enabled":false,"name":"o1-mini (Preview)","object":"model","preview":true,"vendor":"Azure OpenAI","version":"o1-mini-2024-09-12"},{"capabilities":{"family":"o1-ga","limits":{"max_context_window_tokens":200000,"max_prompt_tokens":20000},"object":"model_capabilities","supports":{"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"o1","model_picker_enabled":true,"name":"o1 (Preview)","object":"model","preview":true,"vendor":"Azure OpenAI","version":"o1-2024-12-17"},{"capabilities":{"family":"o1-ga","limits":{"max_context_window_tokens":200000,"max_prompt_tokens":20000},"object":"model_capabilities","supports":{"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"o1-2024-12-17","model_picker_enabled":false,"name":"o1 (Preview)","object":"model","preview":true,"vendor":"Azure OpenAI","version":"o1-2024-12-17"},{"capabilities":{"family":"claude-3.5-sonnet","limits":{"max_context_window_tokens":200000,"max_output_tokens":4096,"max_prompt_tokens":195000},"object":"model_capabilities","supports":{"parallel_tool_calls":true,"tool_calls":true},"tokenizer":"o200k_base","type":"chat"},"id":"claude-3.5-sonnet","model_picker_enabled":true,"name":"Claude 3.5 Sonnet (Preview)","object":"model","policy":{"state":"enabled","terms":"Enable access to the latest Claude 3.5 Sonnet model from Anthropic. [Learn more about how GitHub Copilot serves Claude 3.5 Sonnet](https://docs.github.com/copilot/using-github-copilot/using-claude-sonnet-in-github-copilot)."},"preview":true,"vendor":"Anthropic","version":"claude-3.5-sonnet"}],"object":"list"}
diff --git a/src/lib/paths.ts b/src/lib/paths.ts
@@ -0,0 +1,11 @@
+import os from "node:os"
+import path from "pathe"
+
+const DIR_CACHE = path.join(os.homedir(), ".cache", "copilot-api")
+
+const PATH_TOKEN_CACHE = path.join(DIR_CACHE, "token")
+
+export const PATHS = {
+  DIR_CACHE,
+  PATH_TOKEN_CACHE,
+}
diff --git a/src/services/copilot-vscode/api-instance.ts b/src/services/copilot-vscode/api-instance.ts
@@ -0,0 +1,18 @@
+import { ofetch } from "ofetch"
+
+import { getToken } from "./get-token/service"
+
+const result = await getToken()
+
+export const COPILOT_VSCODE_BASE_URL =
+  "https://api.individual.githubcopilot.com"
+export const COPILOT_VSCODE_TOKEN = result.token
+export const COPILOT_VSCODE_HEADERS = {
+  authorization: `Bearer ${COPILOT_VSCODE_TOKEN}`,
+  "copilot-integration-id": "vscode-chat",
+}
+
+export const copilotVSCode = ofetch.create({
+  baseURL: COPILOT_VSCODE_BASE_URL,
+  headers: COPILOT_VSCODE_HEADERS,
+})
diff --git a/src/services/copilot-vscode/chat-completions/service.ts b/src/services/copilot-vscode/chat-completions/service.ts
@@ -0,0 +1,54 @@
+import { FetchError } from "ofetch"
+
+import type { ChatCompletionsPayload } from "./types"
+
+import {
+  COPILOT_VSCODE_BASE_URL,
+  COPILOT_VSCODE_HEADERS,
+  copilotVSCode,
+} from "../api-instance"
+
+export async function* chatCompletions(payload: ChatCompletionsPayload) {
+  try {
+    const response = await copilotVSCode.native(
+      COPILOT_VSCODE_BASE_URL + "/chat/completions",
+      {
+        method: "POST",
+        body: JSON.stringify(payload),
+        headers: COPILOT_VSCODE_HEADERS,
+      },
+    )
+
+    console.log(await response.text())
+
+    // if (!response.body) {
+    //   throw new Error("No response body")
+    // }
+
+    // const reader = response.body.getReader()
+
+    // // eslint-disable-next-line @typescript-eslint/no-unnecessary-condition
+    // while (true) {
+    //   const { done, value } = await reader.read()
+
+    //   if (done) {
+    //     console.log("done")
+    //     console.log(value)
+    //     break
+    //   }
+
+    //   console.log("value", value)
+    // }
+
+    // for await (const chunk of response.body) {
+    //   console.log(chunk)
+    // }
+
+    yield "tono"
+  } catch (e) {
+    console.error(e)
+    if (e instanceof FetchError) {
+      console.error(e.response?._data)
+    }
+  }
+}
diff --git a/src/services/copilot-vscode/chat-completions/types.ts b/src/services/copilot-vscode/chat-completions/types.ts
@@ -0,0 +1,86 @@
+// Request types
+
+interface Message {
+  role: string
+  content: string
+}
+
+export interface ChatCompletionsPayload {
+  messages: Array<Message>
+  model: string
+  temperature?: number
+  top_p?: number
+  max_tokens?: number
+  stop?: Array<string>
+  n?: number
+  stream?: boolean
+}
+
+// Response types
+
+interface ContentFilterResults {
+  error: {
+    code: string
+    message: string
+  }
+  hate: {
+    filtered: boolean
+    severity: string
+  }
+  self_harm: {
+    filtered: boolean
+    severity: string
+  }
+  sexual: {
+    filtered: boolean
+    severity: string
+  }
+  violence: {
+    filtered: boolean
+    severity: string
+  }
+}
+
+interface ContentFilterOffsets {
+  check_offset: number
+  start_offset: number
+  end_offset: number
+}
+
+interface Delta {
+  content: string | null
+  role?: string
+}
+
+interface Choice {
+  index: number
+  content_filter_offsets?: ContentFilterOffsets
+  content_filter_results?: ContentFilterResults
+  delta: Delta
+  finish_reason?: string | null
+}
+
+interface PromptFilterResult {
+  content_filter_results: ContentFilterResults
+  prompt_index: number
+}
+
+interface Usage {
+  completion_tokens: number
+  prompt_tokens: number
+  total_tokens: number
+}
+
+interface ChatCompletionResponse {
+  choices: Array<Choice>
+  created: number
+  id: string
+  model: string
+  system_fingerprint?: string
+  prompt_filter_results?: Array<PromptFilterResult>
+  usage?: Usage
+}
+
+export type ChatCompletionsChunk =
+  | { data: ChatCompletionResponse }
+  | { data: "[DONE]" }
diff --git a/src/services/copilot-vscode/get-models/service.ts b/src/services/copilot-vscode/get-models/service.ts
@@ -0,0 +1,8 @@
+import type { GetModelsResponse } from "./types"
+
+import { copilotVSCode } from "../api-instance"
+
+export const getModels = () =>
+  copilotVSCode<GetModelsResponse>("/models", {
+    method: "GET",
+  })
diff --git a/src/services/copilot-vscode/get-models/types.ts b/src/services/copilot-vscode/get-models/types.ts
@@ -0,0 +1,41 @@
+interface ModelLimits {
+  max_context_window_tokens?: number
+  max_output_tokens?: number
+  max_prompt_tokens?: number
+  max_inputs?: number
+}
+
+interface ModelSupports {
+  tool_calls?: boolean
+  parallel_tool_calls?: boolean
+  dimensions?: boolean
+}
+
+interface ModelCapabilities {
+  family: string
+  limits: ModelLimits
+  object: string
+  supports: ModelSupports
+  tokenizer: string
+  type: string
+}
+
+interface Model {
+  capabilities: ModelCapabilities
+  id: string
+  model_picker_enabled: boolean
+  name: string
+  object: string
+  preview: boolean
+  vendor: string
+  version: string
+  policy?: {
+    state: string
+    terms: string
+  }
+}
+
+export interface GetModelsResponse {
+  data: Array<Model>
+  object: string
+}
diff --git a/src/services/copilot-vscode/get-token/service.ts b/src/services/copilot-vscode/get-token/service.ts
@@ -0,0 +1,83 @@
+import consola from "consola"
+import { execa } from "execa"
+
+import { PATHS } from "~/lib/paths"
+
+import type { GetTokenResponse } from "./types"
+
+const TEN_MINUTES = 10 * 60 * 1000
+
+// @ts-expect-error TypeScript can't analyze timeout
+export async function getToken(): Promise<GetTokenResponse> {
+  try {
+    const cachedToken = await readCachedToken()
+
+    if (Date.now() - cachedToken.expires_at > ONE_DAY) {
+      return cachedToken
+    }
+  } catch (e) {
+    if (!(e instanceof Error)) throw e
+    if (e.message === "No such file or directory")
+      consola.info(`No cached token found in ${PATHS.PATH_TOKEN_CACHE}`)
+  }
+
+  // Kill any existing vscode processes
+  // otherwise, no token call will be made
+  await killVSCodeProcesses()
+
+  const mitmdump = createMitmdumpProcess()
+  void createVSCodeProcess()
+
+  const timeout = setTimeout(() => {
+    throw new Error("Timed out waiting for token")
+  }, 30_000)
+
+  for await (const line of mitmdump.stdout) {
+    if (typeof line !== "string") continue
+    if (!line.includes("tid=")) continue
+
+    consola.debug(`Found token output line: ${line}`)
+
+    clearTimeout(timeout)
+
+    await killVSCodeProcesses()
+    mitmdump.kill()
+
+    const parsed = JSON.parse(line) as GetTokenResponse
+    parsed.expires_at = Date.now() + t
+
+    await writeCachedToken(line)
+    return JSON.parse(line) as GetTokenResponse
+  }
+}
+
+const createMitmdumpProcess = () =>
+  execa({ reject: false })("mitmdump", [
+    "--flow-detail",
+    "4",
+    "~m GET & ~u https://api.github.com/copilot_internal/v2/token",
+  ])
+
+const createVSCodeProcess = () =>
+  execa({
+    reject: false,
+    env: {
+      http_proxy: "http://127.0.0.1:8080",
+      https_proxy: "http://127.0.0.1:8080",
+    },
+  })("code", [
+    "--ignore-certificate-errors",
+    // Can be whatever folder, as long as it's trusted by vscode
+    // https://code.visualstudio.com/docs/editor/workspace-trust
+    "/home/erick/Documents/sides/playground/",
+  ])
+
+const killVSCodeProcesses = () => execa({ reject: false })("pkill", ["code"])
+
+const readCachedToken = async () => {
+  const content = await Bun.file(PATHS.PATH_TOKEN_CACHE).text()
+  return JSON.parse(content) as GetTokenResponse
+}
+
+const writeCachedToken = async (token: string) =>
+  Bun.write(PATHS.PATH_TOKEN_CACHE, token)
diff --git a/src/services/copilot-vscode/get-token/types.ts b/src/services/copilot-vscode/get-token/types.ts
@@ -0,0 +1,31 @@
+export interface GetTokenResponse {
+  annotations_enabled: boolean
+  chat_enabled: boolean
+  chat_jetbrains_enabled: boolean
+  code_quote_enabled: boolean
+  code_review_enabled: boolean
+  codesearch: boolean
+  copilotignore_enabled: boolean
+  endpoints: {
+    api: string
+    "origin-tracker": string
+    proxy: string
+    telemetry: string
+  }
+  expires_at: number
+  individual: boolean
+  limited_user_quotas: null
+  limited_user_reset_date: null
+  nes_enabled: boolean
+  prompt_8k: boolean
+  public_suggestions: "disabled"
+  refresh_in: number
+  sku: "free_educational"
+  snippy_load_test_enabled: boolean
+  telemetry: "disabled"
+  token: string
+  tracking_id: string
+  vsc_electron_fetcher_v2: boolean
+  xcode: boolean
+  xcode_chat: boolean
+}
diff --git a/src/services/copilot-web/api-instance.ts b/src/services/copilot-web/api-instance.ts
@@ -0,0 +1,11 @@
+import { ofetch } from "ofetch"
+
+import { ENV } from "~/lib/env"
+
+export const copilotWeb = ofetch.create({
+  baseURL: "https://api.individual.githubcopilot.com",
+  headers: {
+    authorization: ENV.GITHUB_AUTH_HEADER,
+    "copilot-integration-id": "copilot-chat",
+  },
+})
diff --git a/src/services/copilot-web/create-message/service.ts b/src/services/copilot-web/create-message/service.ts
diff --git a/src/services/copilot-web/create-message/types.ts b/src/services/copilot-web/create-message/types.ts
diff --git a/src/services/copilot-web/create-thread/service.ts b/src/services/copilot-web/create-thread/service.ts