Replit jako przykład jak wykorzystać open source w AI / by Kuba Filipowski

  1. Jednym z ambitniejszych projektów nowej fali startupów wspieranych generatywnym AI jest Replit.

  2. Replit to środowisko programistyczne (IDE) działające w przeglądarce i umożliwiające współpracę w czasie rzeczywistym nad kodem. Coś jak Google Docs dla programistów.

  3. Replit jest świetnym produktem dla ludzi uczących się programować. Dzięki temu, że jest w przeglądarce i pozwala od razu uruchamiać napisany program na serwerze Replit, omija się cały etap konfiguracji i od razu można zacząć pisać kod.

  4. W Replit wszystko co robimy jest publiczne, to sprawia, że możemy korzystać z projektów i kodu innych ludzi jako startu dla naszego projektu. Oczywiście na Githubie też jest masa gotowego open source kodu. Jednak w Replit brak konieczności konfiguracji bardzo ułatwia start zabawy w programowanie.

    1. Jak uczyłem się HTMLa to moim głównym źródłem wiedzy była opcja “pokaż źródło”, która w tamtych czasach była dostępna w każdej przeglądarce. Podglądanie kodu napisanego przez innych i możliwość eksperymentowania z nim (“co się stanie jak to usunę?”) jest fundamentalne.

    2. Siłą HTMLa jest to, że nic nie trzeba konfigurować, żeby wyświetlić stronę. Przeglądarka po prostu ją renderuje.

    3. W przypadku języków programowania typu Python trzeba trochę poczytać i popracować, żeby uruchomić cokolwiek. Replit redukuje ten problem do kliknięcia.

  5. Pod koniec października 2022 Replit dodał funkcję Ghostwriter, czyli narzędzie AI do uzupełniania, tworzenia, transformowania i wyjaśniania kodu.

  6. Ghostwriter jest podobny do Githubowego Copilota z tą różnicą, że Copilot działa w oparciu o API OpenAI Codex, a Ghostwriter to autorski model Replit, którzy działa na ich serwerze, nad którym mają pełną kontrolę.

    1. OpenAI Codex to płatne API, Github wydał Copilota zanim to API było dostępne w prywatnej becie dla klientów OpenAI. Github to spółka Microsoftu, a Microsoft ma specjalna relację z OpenAI.

  7. Znalazłem rozmowę w której CEO Replit tłumaczy w jaki sposób zbudowali Ghostwriter. W skrócie:

    1. Chcieli kontrolować doświadczenie użytkownika: szybkość działania i jakość wyników.

    2. Chcieli też mieć możliwość poprawiania modelu w oparciu o feedback użytkowników. To sprawiło, że nie zdecydowali się na API OpenAI.

    3. Znaleźli open sourcowy projekt Codegen od Salesforce, który stał się fundamentem pierwszej wersji Ghostwritera.

    4. Do tego Ghostwriter korzysta z projektu FasterTransformer i Triton Inference Server (oba projekty to open source od NVIDIA)

    5. Przez dwa tygodnie pracowali nad przyspieszeniem działania Codegen, dostrajaniem go i znalezieniem sposobu na poprawianie modelu w locie, w oparciu o feedback użytkowników.

    6. Wydali pierwszą wersję, użytkownicy byli entuzjastyczni, stworzyli więc swoją własną wersję modelu i wytrenowali go od podstaw.

  8. Dlaczego to jest ciekawe?

    1. Replit to relatywnie mała firma, zatrudnia 100 osób. Ma dużo pieniędzy i wysoką wycenę, ale jest to dużo mniejsza firma niż OpenAI, Github i oczywiście Microsoft.

    2. Wybrali drogę tworzenia swojego własnego modelu bo chcieli kontrolować doświadczenie użytkownika. Prawdopodobnie chcieli też być niezależni od decyzji biznesowych OpenAI i kosztów, które OpenAI dyktuje.

    3. Droga, którą wybrali, czyli tworzenia własnego modelu, brzmi jak trudna droga, ale przebyli ją w czasie dwóch tygodni. Dzięki open source.

    4. Ghostwriter ma więcej możliwości niż Copilot. Copilot uzupełnia kod i generuje kod w oparciu o język naturalny, Ghostwriter dodatkowo potrafi wyjaśnić kod (czyli tłumaczy naturalnym językiem co dany kod robi) i przepisywać kod (sugeruje jak osiągnąć ten sam efekt w bardziej elegancki sposób).

  9. Ghostwriter powstał jako wewnętrzny projekt Replit bo mógł. Korzysta z open source jako fundamentu, bo wiele firm publikuje swoje modele jako open source i jest z czego wybierać. Ma też swoje własne dane, które dodatkowo “uszlachetniają” finalny produkt.

  10. Wydaje się, że to słuszna decyzja zarówno technologiczna, produktowa jak i biznesowa. Niezależność od OpenAI to fosa produktowa, która zwiększa wartość Replit.

  11. Replit to inspiracja jak można tworzyć zaawansowane projekty AI. Szybko przetestować koncept, wykorzystać open source i unikalne zbiory danych by poprawić działanie modelu, kontrolować całe doświadczenie użytkownika.

  12. Myślę, że wielu CEO startupów wybierze ten kierunek. Może początkowo przetestują koncept w oparciu o płatne API OpenAI, ale jak tylko uzyskają potwierdzenie od rynku, że dany kierunek ma sens to zaczną tworzyć swoje własne IP w oparciu o open source.