RubyGems - summarize-meeting - Versions diffs - 0.1.0 - Mend

summarize-meeting 0.1.0

Files changed (5) hide show

checksums.yaml ADDED Viewed

@@ -0,0 +1,7 @@
+---
+SHA256:
+  metadata.gz: 3b6ec76b5b3462260a5ea23a4768000ac6ff34de4cb7436cb9a612e9ed18c526
+  data.tar.gz: 1650a37e387b5917a4b651caadf2b755b9370ae5a9298ce2c61d29889f89b1e4
+SHA512:
+  metadata.gz: ee9f26149f5bc591103d49cf6cbf3a6706a3a267aa48db8c4c13acea6ca2f904e83e6c35604f25323a39f18f2f8a7d0db0813190d7ffbeda5137fb22438429b0
+  data.tar.gz: 2671cd220684d611ac5681d7f734732c0841b23cf715674923c23e5cee0bc3d6e6cfa84834038db405889c43378b536a99f37dd71569c94c6ced26c05d032c73

data/bin/summarize-meeting ADDED Viewed

@@ -0,0 +1,65 @@
+#!/usr/bin/env ruby
+require "optparse"
+require "dotenv/load"
+require_relative "../lib/meeting"
+def main
+  options = {}
+  OptionParser.new do |opts|
+    opts.banner = "Usage: summarize-meeting.rb [options] input-file"
+    opts.on("-h", "--help", "Prints this help") do
+      puts opts
+      exit
+    end
+    opts.on("-o", "--output-file FILE", "The file to write the summary to") do |file|
+      options[:output_file] = file
+    end
+    if ENV["OPENAI_KEY"]
+      options[:openai_key] = ENV["OPENAI_KEY"]
+    end
+    opts.on("-k", "--openai-key KEY", "The OpenAI API key to use") do |key|
+      options[:openai_key] = key
+    end
+    if ENV["OPENAI_ORG"]
+      options[:openai_org] = ENV["OPENAI_ORG"]
+    end
+    opts.on("-g", "--openai-org ORG", "The OpenAI organization ID to use") do |org|
+      options[:openai_org] = org
+    end
+  end.parse!
+  Ai.access_token = options[:openai_key] if options[:openai_key]
+  Ai.organization_id = options[:openai_org] if options[:openai_org]
+  if ARGV.length != 1
+    puts "Error: You must specify a transcript file to summarize."
+    exit 1
+  end
+  transcript_file = ARGV[0]
+  transcript = File.read(transcript_file)
+  meeting = Meeting.new(transcript)
+  summary = meeting.summarize
+  summary_file_name = if options[:output_file]
+    options[:output_file]
+  else
+    transcript_file_basename = File.basename(transcript_file, ".*")
+    summary_file_name = "#{transcript_file_basename}-summary.txt"
+  end
+  File.write(summary_file_name, summary)
+end
+if __FILE__ == $0
+  main
+end

data/lib/ai.rb ADDED Viewed

@@ -0,0 +1,26 @@
+require "openai"
+module Ai
+  @@access_token = ENV["OPENAI_KEY"]
+  @@organization_id = ENV["OPENAI_ORG"]
+  def self.client
+    OpenAI::Client.new(access_token: access_token, organization_id: organization_id)
+  end
+  def self.access_token
+    @@access_token
+  end
+  def self.organization_id
+    @@organization_id
+  end
+  def self.access_token=(token)
+    @@access_token = token
+  end
+  def self.organization_id=(id)
+    @@organization_id = id
+  end
+end

data/lib/meeting.rb ADDED Viewed

@@ -0,0 +1,130 @@
+require "json"
+require "mustache"
+require "openai"
+require_relative "./ai"
+class Meeting
+  LINE_SUMMARY_PROMPT_TEMPLATE = [
+    {
+      role: "system",
+      content: "You are an assistant summarizing a meeting.",
+    },
+    {
+      role: "system",
+      content: "The transcript of the meeting is split into {{chunkCount}} chunks. This is the {{chunkIndex}} chunk.",
+    },
+    {
+      role: "assistant",
+      content: "Please provide me with the next chunk of the transcript.",
+    },
+    {
+      role: "user",
+      content: "{{chunk}}",
+    }
+  ]
+  CONSOLIDATED_SUMMARY_PROMPT_TEMPLATE = [
+    {
+      role: "system",
+      content: "You are an assistant summarizing a meeting.",
+    },
+    {
+      role: "system",
+      content: "Notes about the meeting have been compiled.",
+    },
+    {
+      role: "system",
+      content: <<~CONTENT
+        Your job is to write a thorough summary of the meeting.
+        The summary should start with a brief overview of the meeting.
+        The summary should be detailed and should extract any action items that were discussed.
+        The summary should be organized into sections with headings and bullet points.
+        The summary should include a list of attendees.
+        The order of the sections should be overview, attendees, action items, and detailed notes by topic.
+      CONTENT
+    },
+    {
+      role: "assistant",
+      content: "Please provide me with notes from the meeting.",
+    },
+    {
+      role: "user",
+      content: "{{notes}}",
+    }
+  ]
+  def initialize(transcript)
+    @transcript = transcript
+  end
+  attr_reader :transcript
+  def summarize
+    # Step 1. Split the transcript into lines.
+    lines = transcript.split("\n")
+    # Step 2. Calculate the maximum chunk size in words.
+    max_total_tokens = 4000
+    response_token_reserve = 500
+    template_tokens = LINE_SUMMARY_PROMPT_TEMPLATE.map { |line| line[:content].split.size }.sum
+    max_chunk_tokens = max_total_tokens - response_token_reserve - template_tokens
+    words_per_token = 0.7
+    max_chunk_word_count = max_chunk_tokens * words_per_token
+    # Step 3. Split the transcript into equally sized chunks.
+    chunks = split_lines_into_equal_size_chunks(lines, max_chunk_word_count)
+    # Step 4. Summarize each chunk.
+    previous_chunks_summary = ""
+    chunks.each_with_index do |chunk, chunk_index|
+      chunk_summary = summarize_chunk(chunk, chunk_index, chunks.size, previous_chunks_summary)
+      previous_chunks_summary += chunk_summary
+    end
+    # Step 5. Write a consolidated summary.
+    consolidated_template = CONSOLIDATED_SUMMARY_PROMPT_TEMPLATE
+    prompt = Mustache.render(consolidated_template.to_json, { notes: previous_chunks_summary.to_json })
+    messages = JSON.parse(prompt)
+    response = Ai.client.chat(
+      parameters: {
+        model: "gpt-3.5-turbo",
+        messages: messages,
+      }
+    )
+    response.dig("choices", 0, "message", "content")
+  end
+  def summarize_chunk(chunk, chunk_index, chunk_count, previous_chunks_summary)
+    template = LINE_SUMMARY_PROMPT_TEMPLATE
+    prompt = Mustache.render(template.to_json, { chunkCount: chunk_count, chunkIndex: chunk_index + 1, chunk: chunk.join("\n").to_json })
+    messages = JSON.parse(prompt)
+    response = Ai.client.chat(
+      parameters: {
+        model: "gpt-3.5-turbo",
+        messages: messages,
+      }
+    )
+    response.dig("choices", 0, "message", "content")
+  end
+  def split_lines_into_equal_size_chunks(lines, max_chunk_word_count)
+    chunks = []
+    chunk = []
+    chunk_word_count = 0
+    lines.each do |line|
+      line_word_count = line.split.size
+      if chunk_word_count + line_word_count > max_chunk_word_count
+        chunks << chunk
+        chunk = []
+        chunk_word_count = 0
+      end
+      chunk << line
+      chunk_word_count += line_word_count
+    end
+    chunks << chunk
+    chunks
+  end
+end

metadata ADDED Viewed

@@ -0,0 +1,158 @@
+--- !ruby/object:Gem::Specification
+name: summarize-meeting
+version: !ruby/object:Gem::Version
+  version: 0.1.0
+platform: ruby
+authors:
+- Sean Devine
+autorequire:
+bindir: bin
+cert_chain: []
+date: 2023-03-03 00:00:00.000000000 Z
+dependencies:
+- !ruby/object:Gem::Dependency
+  name: optparse
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :runtime
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: dotenv
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :runtime
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: ruby-openai
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :runtime
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: mustache
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :runtime
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: rspec
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: guard-rspec
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: vcr
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+- !ruby/object:Gem::Dependency
+  name: webmock
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - ">="
+      - !ruby/object:Gem::Version
+        version: '0'
+description: A command line utility that summarizes a meeting using generative language
+  models.
+email: sean-devine@x-b-e.com
+executables:
+- summarize-meeting
+extensions: []
+extra_rdoc_files: []
+files:
+- bin/summarize-meeting
+- lib/ai.rb
+- lib/meeting.rb
+homepage:
+licenses: []
+metadata: {}
+post_install_message:
+rdoc_options: []
+require_paths:
+- "."
+required_ruby_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+required_rubygems_version: !ruby/object:Gem::Requirement
+  requirements:
+  - - ">="
+    - !ruby/object:Gem::Version
+      version: '0'
+requirements: []
+rubygems_version: 3.1.4
+signing_key:
+specification_version: 4
+summary: A command line utility that summarizes a meeting
+test_files: []