使用ffmpeg给视频自动添加字幕

今天看到一篇“一个视频自动加字幕的小工具,如何做到月入2W”的博文(突字幕),考虑这个小工具如何实现,以及可能的关键难点,感觉有点意思;在当前人工智能、机器学习的热潮下,在依托成熟三方服务或者开源实现,实现一个类似的应用还是不难的,而核心的技术难点也显而易见,主要在语音识别,以及机器翻译的准确性上!关键功能点,给视频自动添加多语种字幕,大概的实现流程:1、视频中音频部分提取,含时间戳!2、语音识别,音频部分
阅读全文

FMP4与DASH的概念理解

查找HLS的切片格式的时候发现有ABR/DASH/FMP4等新概念,记录下这些概念,以备后续使用!
阅读全文

一个UDP可读缓冲区不够导致丢包的现象

今天看到一篇写UDP 丢包场景的文章,其中提到如果UDP 缓冲区填满导致丢包的问题,写了个小程序验证了下,确实之前没有细究过,如何解决,以libevent测试程序为例,在接收到缓冲区有数据的事件后,首先通过如下的方法,或者libevent封装的方法,获取到系统缓冲区中可读数据的大小,然后申请到对应大小的buffer去调用recvfrom方法,否则会出现如上UDP可读缓冲区小余可读数据的情况,导致出现UDP数据读不全的问题!
阅读全文

Jitsi服务器搭建过程问题记录

Jitsi是一个基于WebRTC的开源会议服务系统,主要提供高质量、安全、可扩展性强的视频会议能力;使用网上的安装过程,大都第一次能正常的安装,并打开一个人的会议,但未必能调通多人的会议功能,从github的Issure中,包括很多类似的问题“Jitsi-videobridge2 Failed to select initial bridge for participantRegion=null”,而且还很多,将修复的过程做了记录
阅读全文

docker安装zulip服务

zulip号称是特性强大的企业版即时聊天应用,开源并且有超过500家企业部署使用,出于好奇,所以安装了一个版本体验体验,国内鲜有安装过程记录,有一个通过docker-compose安装的脚本,但zulip的容器启动总是报错,所以单独安装了一遍,记录安装过程中的错误。
阅读全文

WebRTC技术概览

这是两年前刚接触WebRTC时整理的PPT,分享出来!从WebRTC技术概览、WebRTC客户端技术、WebRTC服务端技术三个方面来梳理!
阅读全文

Windows端快速实现一个符合国标的SIP客户端!

主要需要实现如下几个核心能力:1、支持GB28181的SIP协议栈;2、网络框架,处理UDP、TCP等Socket;3、H264/H265/AAC/OPUS/等编码和解码库;4、解码播放显示框架;主要三方框架:1、网络框架使用ZLMediaKit中的zltoolkit ;2、sip协议栈使用sip_sofia ;3、codec包括ffmpeg/x264/openh264, ilbc,faac,fa
阅读全文

medooze mcu的安装与测试使用

medooze的mcu源码还是比较好理解的,Modooze 异步 I/O 事件处理机制是依靠 poll 来驱动的,目录清晰,代码结构也不复杂​,适合用来做mcu框架的参考!
阅读全文

基于ZLMediaKit,实现一个接收多路rtp流,输出一路rtmp流的简单MCU!

做转码服务的原型时,看了看MCU的实现,考虑到如果不做转码,可以将多路rtp流直接合成为一路rtmp流输出,这样对于多人连麦,然后转发直播的实现就很方便了,所以做了这个功能的实现!同转码服务的类图设计:基础库是ZLMediaKit,确实很方便!直接上代码:TranscoderTaskManager.h可以使用linux的nc 127.0.0.1 3500 进行客户端测
阅读全文

ffmpeg推流命令总结

今天考虑一个mcu混合的实现,也就是接收多路过来的rtp流,然后转发出去一路的rtmp流,使用ffmpeg测试做的记录,刚开始一直通过ffmpeg推送的文件流不能满足要求,还是对参数配置不熟悉;
阅读全文
首页 12 末页 共 19 条记录