Track usage in OpenAI and Claude models

intitni · intitni · commit e430646293a9 · 2024-10-19T20:20:26.000+08:00
diff --git a/Tool/Sources/OpenAIService/APIs/BuiltinExtensionChatCompletionsService.swift b/Tool/Sources/OpenAIService/APIs/BuiltinExtensionChatCompletionsService.swift
@@ -51,7 +51,8 @@ extension BuiltinExtensionChatCompletionsService: ChatCompletionsAPI {
             model: model,
             message: .init(role: .assistant, content: content),
             otherChoices: [],
-            finishReason: ""
+            finishReason: "",
+            usage: nil
         )
     }
 }
diff --git a/Tool/Sources/OpenAIService/APIs/ChatCompletionsAPIDefinition.swift b/Tool/Sources/OpenAIService/APIs/ChatCompletionsAPIDefinition.swift
@@ -182,12 +182,21 @@ struct ChatCompletionsStreamDataChunk {
         var content: String?
         var toolCalls: [ToolCall]?
     }
+    
+    struct Usage: Codable, Equatable {
+        var promptTokens: Int?
+        var completionTokens: Int?
+        
+        var cachedTokens: Int?
+        var otherUsage: [String: Int]
+    }
 
     var id: String?
     var object: String?
     var model: String?
     var message: Delta?
     var finishReason: String?
+    var usage: Usage?
 }
 
 // MARK: - Non Stream API
@@ -198,12 +207,39 @@ protocol ChatCompletionsAPI {
 
 struct ChatCompletionResponseBody: Codable, Equatable {
     typealias Message = ChatCompletionsRequestBody.Message
+    
+    struct Usage: Codable, Equatable {
+        var promptTokens: Int
+        var completionTokens: Int
+        
+        var cachedTokens: Int
+        var otherUsage: [String: Int]
+        
+        mutating func merge(with other: ChatCompletionsStreamDataChunk.Usage) {
+            promptTokens += other.promptTokens ?? 0
+            completionTokens += other.completionTokens ?? 0
+            cachedTokens += other.cachedTokens ?? 0
+            for (key, value) in other.otherUsage {
+                otherUsage[key, default: 0] += value
+            }
+        }
+        
+        mutating func merge(with other: Self) {
+            promptTokens += other.promptTokens
+            completionTokens += other.completionTokens
+            cachedTokens += other.cachedTokens
+            for (key, value) in other.otherUsage {
+                otherUsage[key, default: 0] += value
+            }
+        }
+    }
 
     var id: String?
     var object: String
     var model: String
     var message: Message
     var otherChoices: [Message]
     var finishReason: String
+    var usage: Usage?
 }
 
diff --git a/Tool/Sources/OpenAIService/APIs/ClaudeChatCompletionsService.swift b/Tool/Sources/OpenAIService/APIs/ClaudeChatCompletionsService.swift
@@ -1,6 +1,6 @@
 import AIModel
-import ChatBasic
 import AsyncAlgorithms
+import ChatBasic
 import CodableWrappers
 import Foundation
 import Logger
@@ -57,6 +57,7 @@ public actor ClaudeChatCompletionsService: ChatCompletionsStreamAPI, ChatComplet
         var content_block: ContentBlock?
         var delta: Delta?
         var error: APIError?
+        var usage: ResponseBody.Usage?
 
         struct Message: Decodable {
             var id: String
@@ -66,7 +67,7 @@ public actor ClaudeChatCompletionsService: ChatCompletionsStreamAPI, ChatComplet
             var model: String
             var stop_reason: String?
             var stop_sequence: String?
-            var usage: Usage?
+            var usage: ResponseBody.Usage?
         }
 
         struct ContentBlock: Decodable {
@@ -75,16 +76,10 @@ public actor ClaudeChatCompletionsService: ChatCompletionsStreamAPI, ChatComplet
         }
 
         struct Delta: Decodable {
-            var type: String
+            var type: String?
             var text: String?
             var stop_reason: String?
             var stop_sequence: String?
-            var usage: Usage?
-        }
-
-        struct Usage: Decodable {
-            var input_tokens: Int?
-            var output_tokens: Int?
         }
     }
 
@@ -112,6 +107,8 @@ public actor ClaudeChatCompletionsService: ChatCompletionsStreamAPI, ChatComplet
         struct Usage: Codable, Equatable {
             var input_tokens: Int?
             var output_tokens: Int?
+            var cache_creation_input_tokens: Int?
+            var cache_read_input_tokens: Int?
         }
 
         var id: String?
@@ -184,7 +181,7 @@ public actor ClaudeChatCompletionsService: ChatCompletionsStreamAPI, ChatComplet
             var text: String
             var cache_control: CacheControl?
         }
-        
+
         struct Tool: Encodable, Equatable {
             var name: String
             var description: String
@@ -325,13 +322,26 @@ extension ClaudeChatCompletionsService.ResponseBody {
                 }
             ),
             otherChoices: [],
-            finishReason: stop_reason ?? ""
+            finishReason: stop_reason ?? "",
+            usage: .init(
+                promptTokens: usage.input_tokens ?? 0,
+                completionTokens: usage.output_tokens ?? 0,
+                cachedTokens: usage.cache_read_input_tokens ?? 0,
+                otherUsage: {
+                    var otherUsage = [String: Int]()
+                    if let cacheCreation = usage.cache_creation_input_tokens {
+                        otherUsage["cache_creation_input_tokens"] = cacheCreation
+                    }
+                    return otherUsage
+                }()
+            )
         )
     }
 }
 
 extension ClaudeChatCompletionsService.StreamDataChunk {
     func formalized() -> ChatCompletionsStreamDataChunk {
+        let usage = usage ?? message?.usage
         return .init(
             id: message?.id,
             object: "chat.completions",
@@ -345,7 +355,19 @@ extension ClaudeChatCompletionsService.StreamDataChunk {
                 }
                 return nil
             }(),
-            finishReason: delta?.stop_reason
+            finishReason: delta?.stop_reason,
+            usage: .init(
+                promptTokens: usage?.input_tokens ,
+                completionTokens: usage?.output_tokens,
+                cachedTokens: usage?.cache_read_input_tokens,
+                otherUsage: {
+                    var otherUsage = [String: Int]()
+                    if let cacheCreation = usage?.cache_creation_input_tokens {
+                        otherUsage["cache_creation_input_tokens"] = cacheCreation
+                    }
+                    return otherUsage
+                }()
+            )
         )
     }
 }
diff --git a/Tool/Sources/OpenAIService/APIs/GoogleAIChatCompletionsService.swift b/Tool/Sources/OpenAIService/APIs/GoogleAIChatCompletionsService.swift
@@ -227,7 +227,7 @@ extension ModelContent {
         case .assistant:
             if let toolCalls = message.toolCalls {
                 return toolCalls.map { call in
-                    return """
+                    """
                     Function ID: \(call.id)
                     Call function: \(call.function.name)
                     Arguments: \(call.function.arguments ?? "{}")
@@ -277,7 +277,8 @@ extension GenerateContentResponse {
             model: "",
             message: message,
             otherChoices: otherMessages,
-            finishReason: candidates.first?.finishReason?.rawValue ?? ""
+            finishReason: candidates.first?.finishReason?.rawValue ?? "",
+            usage: nil
         )
     }
 
diff --git a/Tool/Sources/OpenAIService/APIs/OlamaChatCompletionsService.swift b/Tool/Sources/OpenAIService/APIs/OlamaChatCompletionsService.swift
@@ -94,7 +94,8 @@ extension OllamaChatCompletionsService: ChatCompletionsAPI {
                 )
             } ?? .init(role: .assistant, content: ""),
             otherChoices: [],
-            finishReason: ""
+            finishReason: "",
+            usage: nil
         )
     }
 }
diff --git a/Tool/Sources/OpenAIService/APIs/OpenAIChatCompletionsService.swift b/Tool/Sources/OpenAIService/APIs/OpenAIChatCompletionsService.swift
@@ -95,6 +95,7 @@ actor OpenAIChatCompletionsService: ChatCompletionsStreamAPI, ChatCompletionsAPI
         var object: String?
         var model: String?
         var choices: [Choice]?
+        var usage: ResponseBody.Usage?
 
         struct Choice: Codable {
             var delta: Delta?
@@ -143,6 +144,18 @@ actor OpenAIChatCompletionsService: ChatCompletionsStreamAPI, ChatCompletionsAPI
             var prompt_tokens: Int?
             var completion_tokens: Int?
             var total_tokens: Int?
+            var prompt_tokens_details: PromptTokensDetails?
+            var completion_tokens_details: CompletionTokensDetails?
+
+            struct PromptTokensDetails: Codable, Equatable {
+                var cached_tokens: Int?
+                var audio_tokens: Int?
+            }
+
+            struct CompletionTokensDetails: Codable, Equatable {
+                var reasoning_tokens: Int?
+                var audio_tokens: Int?
+            }
         }
 
         var id: String?
@@ -198,14 +211,19 @@ actor OpenAIChatCompletionsService: ChatCompletionsStreamAPI, ChatCompletionsAPI
             var function: ChatGPTFunctionSchema
         }
 
+        struct StreamOptions: Codable, Equatable {
+            var include_usage: Bool = true
+        }
+
         var model: String
         var messages: [Message]
         var temperature: Double?
         var stream: Bool?
         var stop: [String]?
-        var max_tokens: Int?
+        var max_completion_tokens: Int?
         var tool_choice: FunctionCallStrategy?
         var tools: [Tool]?
+        var stream_options: StreamOptions?
     }
 
     var apiKey: String
@@ -295,7 +313,13 @@ actor OpenAIChatCompletionsService: ChatCompletionsStreamAPI, ChatCompletionsAPI
             model: "",
             message: .init(role: .assistant, content: ""),
             otherChoices: [],
-            finishReason: ""
+            finishReason: "",
+            usage: .init(
+                promptTokens: 0,
+                completionTokens: 0,
+                cachedTokens: 0,
+                otherUsage: [:]
+            )
         )
         for try await chunk in stream {
             if let id = chunk.id {
@@ -316,6 +340,9 @@ actor OpenAIChatCompletionsService: ChatCompletionsStreamAPI, ChatCompletionsAPI
             if let text = chunk.message?.content {
                 body.message.content += text
             }
+            if let usage = chunk.usage {
+                body.usage?.merge(with: usage)
+            }
         }
         return body
     }
@@ -357,7 +384,7 @@ actor OpenAIChatCompletionsService: ChatCompletionsStreamAPI, ChatCompletionsAPI
                         forHTTPHeaderField: "OpenAI-Project"
                     )
                 }
-                
+
                 request.setValue("Bearer \(apiKey)", forHTTPHeaderField: "Authorization")
             case .openAICompatible:
                 request.setValue("Bearer \(apiKey)", forHTTPHeaderField: "Authorization")
@@ -420,14 +447,25 @@ extension OpenAIChatCompletionsService.ResponseBody {
             message = .init(role: .assistant, content: "")
             otherMessages = []
         }
+        
+        let usage = ChatCompletionResponseBody.Usage(
+            promptTokens: usage.prompt_tokens ?? 0,
+            completionTokens: usage.completion_tokens ?? 0,
+            cachedTokens: usage.prompt_tokens_details?.cached_tokens ?? 0,
+            otherUsage: [
+                "audio_tokens": usage.completion_tokens_details?.audio_tokens ?? 0,
+                "reasoning_tokens": usage.completion_tokens_details?.reasoning_tokens ?? 0,
+            ]
+        )
 
         return .init(
             id: id,
             object: object,
             model: model,
             message: message,
             otherChoices: otherMessages,
-            finishReason: choices.first?.finish_reason ?? ""
+            finishReason: choices.first?.finish_reason ?? "",
+            usage: usage
         )
     }
 }
@@ -478,7 +516,22 @@ extension OpenAIChatCompletionsService.StreamDataChunk {
                 }
                 return nil
             }(),
-            finishReason: choices?.first?.finish_reason
+            finishReason: choices?.first?.finish_reason,
+            usage: .init(
+                promptTokens: usage?.prompt_tokens,
+                completionTokens: usage?.completion_tokens,
+                cachedTokens: usage?.prompt_tokens_details?.cached_tokens,
+                otherUsage: {
+                    var dict = [String: Int]()
+                    if let audioTokens = usage?.completion_tokens_details?.audio_tokens {
+                        dict["audio_tokens"] = audioTokens
+                    }
+                    if let reasoningTokens = usage?.completion_tokens_details?.reasoning_tokens {
+                        dict["reasoning_tokens"] = reasoningTokens
+                    }
+                    return dict
+                }()
+            )
         )
     }
 }
@@ -576,14 +629,19 @@ extension OpenAIChatCompletionsService.RequestBody {
         temperature = body.temperature
         stream = body.stream
         stop = body.stop
-        max_tokens = body.maxTokens
+        max_completion_tokens = body.maxTokens
         tool_choice = body.toolChoice
         tools = body.tools?.map {
             Tool(
                 type: $0.type,
                 function: $0.function
             )
         }
+        stream_options = if body.stream ?? false {
+            StreamOptions()
+        } else {
+            nil
+        }
     }
 }
 
diff --git a/Tool/Sources/OpenAIService/ChatGPTService.swift b/Tool/Sources/OpenAIService/ChatGPTService.swift

Original file line number	Diff line number	Diff line change
`@@ -51,7 +51,8 @@ extension BuiltinExtensionChatCompletionsService: ChatCompletionsAPI {`
`51`	`51`	`model: model,`
`52`	`52`	`message: .init(role: .assistant, content: content),`
`53`	`53`	`otherChoices: [],`
`54`		`- finishReason: ""`
	`54`	`+ finishReason: "",`
	`55`	`+ usage: nil`
`55`	`56`	`)`
`56`	`57`	`}`
`57`	`58`	`}`
Original file line number	Diff line number	Diff line change
`@@ -94,7 +94,8 @@ extension OllamaChatCompletionsService: ChatCompletionsAPI {`
`94`	`94`	`)`
`95`	`95`	`} ?? .init(role: .assistant, content: ""),`
`96`	`96`	`otherChoices: [],`
`97`		`- finishReason: ""`
	`97`	`+ finishReason: "",`
	`98`	`+ usage: nil`
`98`	`99`	`)`
`99`	`100`	`}`
`100`	`101`	`}`