facebook-pixel

How it works?

Vatis Tech Technology made simple

We've developed a full speech recognition infrastructure, with a potential of models accuracy up to 99%. This is even higher than what a human can do.

...

Problem

Speech recognition is poor and costs too much.

The accuracy of existing speech recognition solutions
75-85%
Existing solutions are almost 4 times more expensive than what we're offering
Expensive
On average, it takes 6 - 12 months for our competitors to improve their technology
Long wait

Why we'll win

Big tech and others' general accuracy lies between 75-85%

Our solution is more accurate even without any training and gets even more accurate over time

How it works

Development process diagram

1. Raw Data

We transcribe the audio data with the current version of our Speech-To-Text model. We split the result into fragments that can be easily analyzed, corrected, and validated. Also, we start an initial self-supervised training process for our technology at this step.

2. In-house labeling

Our team of validators starts to analyze, correct and validate the data from the previous step. They take unlabeled data and label it.

3. Train

When we have enough new hours validated by our team, we re-train the Speech-To-Text model using a supervised technique this time.

4. Deploy

When the training has finished, we deploy the new version of the model. We are also constantly researching better ways to improve our model's architecture.

5. Repeat

We repeat steps 1 - 4 continuously until we push the technology beyond the human level.

State-of-the-art accuracy

Our continuous learning pipeline and our self-supervised neural network architecture gave us a competitive advantage in improving the speech recognition algorithms better and faster.

Accuracy first

These are transcription results for high-quality audio from media broadcasting.

bună ziua domnul moldovanu [missing words] prima emisiune vreau să subliniez bucuria de a fi întru întruna [missing word] studio [missing words]doream să vă întreb dar fiindcă sunteți [...] și asta spună multă spun [missing word] am uitat asupra aprecierea pe care o au locuitorii [...] vizavi de persoana dumneavoastră dar spune multă și despre viziunea dumneavoastră pe termen lung

bună ziua domnule moldovan bună ziua și fiindcă i prima emisiune vreau să subliniez bucuria de a fi într o într un nou studio să zic așa doream să vă întreb dat fiindcă sunteți [...] și asta spune multe spune multe despre aprecierea pe care o au locuitorii [...] vizavi de persoana dumneavoastră dar spune multe și despre viziunea dumneavoastră pe termen lung

These are transcription results for low-quality audio from an online meeting.

dar [missing word] mare parte arată a ce trebuie și ce mai avem noi de făcut acum mai avem partea de intră puțin și la partener slab prins in asta cred ca era ok imediat ca să știi asta cu întrebările sunt separate pentru pagina de raisin de companie și pagina de presiuni de asta da am văzut sunt o din astea [...] da și de asta le am pus separat întrebările fiindcă am zis că poate sunt unele care sunt specifice doar pentru consumuri

dar în mare parte arată a ce trebuie și ce mai avem noi de făcut acum mai avem partea de da intră puțin și la partener la pricing ăsta cred că era ok imediat ca să știi asta cu întrebările sunt separate pentru pagina de pricing de companie și pagina de pricing de asta da am am văzut sunt două din ăstea [...] da și de asta le am pus separat întrebările fiindcă am zis că poate sunt unele care sunt specifice doar pentru consumer

Klarmedia
Klarmedia

At Vatis we found a very helpful product for our business and a great team that reacts every time in the shortest time when we need it. The audio recognition algorithm has an accuracy of approximately 95% in Romanian, and the platform offers very useful facilities for users.

Octavian Petrescu
Founding Partner, Klarmedia

Start building with Speech-To-Text today

1

Sign up for free

Get a free API token, and integrate into your code in seconds. No credit card required.
Start now
2

Start transcribing

Automatically transcribe audio and video files with high accuracy. Vatis Tech Speech-to-Text API is powered by advanced AI research.
Read our API docs
3

Understand your data

Automatically extract key insights and unlock the full potential of your data using our features.
View all features