作者: AI最严厉的父亲

  • 这些AI工具绝对值得你收藏,每一个都是精选,让你的工作事半功倍

    随着ChatGPT的热度飙升,AI工具如雨后春笋般涌现,它们不仅拓宽了我们的能力范围,还显著提升了工作效率。在这里,我们为大家推荐一些精选的AI工具,它们方便你学习和应用AI技术。

    视频生成类

    1. D-ID – 文字转视频,虚拟数字人 D-ID

    D-ID能够将文字内容转化为视频,创造出虚拟数字人,让你制作出你想要的任何内容。

    2. Runway – 文字生成视频 Runway

    Runway让文字一键生成视频成为可能,让你的创意变为现实。

    3. Visla – 文字一键生成视频 Visla

    Visla是另一个优秀的文字转视频工具,助力你轻松创作视频内容。

    4. 一起剪 – 文字转语音视频 一起剪

    一起剪让文字转化为语音视频变得简单,为你的创作增添声音。

    5. 一帧秒创 – 国产AI工具 一帧秒创

    一帧秒创是国产AI工具,为你提供高效视频生成支持。

    智能聊天类

    1. ChatGPT4.0 – 人工智能龙头 ChatGPT4.0

    ChatGPT4.0是目前领先的人工智能工具,为你提供卓越的聊天体验。

    2. NewBing – chatgpt衍生工具 NewBing

    NewBing是从ChatGPT发展而来的新型智能工具,拓宽了AI的应用领域。

    3. 文心一言 – 百度出品,无广告 文心一言

    文心一言由百度推出,目前没有广告干扰,为你提供愉快的聊天体验。

    4. 谷歌巴德 – 谷歌搜索硬刚ChatGPT 谷歌巴德

    谷歌巴德是谷歌的聊天工具,与ChatGPT一较高下,为你提供卓越的搜索体验。

    5. 通义千问 – 阿里也不能缺席 通义千问

    通义千问是阿里巴巴推出的聊天工具,为你解答各种问题。

    6. Alpaca羊驼 – 开源,小众 Alpaca羊驼

    Alpaca羊驼是一个开源的聊天工具,尽管小众但功能强大。

    创意写作文案编辑类

    1. Notion Al – 最好的文档工具 Notion Al

    Notion Al是目前最优秀的文档工具,每个人都应该学习如何使用。

    2. 博思白板 – 创意无限功能 博思白板

    博思白板是一个创意无限的工具,能够激发你的创意灵感。

    3. Copy.ai – 文案助手 Copy.ai

    Copy.ai是一款强大的文案助手,助力你轻松创作。

    4. Copywritely – SEO写作工具 Copywritely

    Copywritely是专注于SEO写作的工具,提升你的内容质量。

    5. 秘塔写作猫 – 国产AI,写作辅导 秘塔写作猫

    秘塔写作猫是国产AI写作工具,为你提供写作辅导支持。

    AI作图类

    1. Midjourney – 领先AI作图工具 Midjourney

    Midjourney是AI作图领域的领先工具,使用人数最多。

    2. Stable Diffusion – 图像可调整 Stable Diffusion

    Stable Diffusion是门槛较高的AI作图工具,但图像可调整性强。

    3. 文心一格 – 百度AI作图 文心一格

    文心一格是百度推出的AI作图工具,提供多样化的图像生成。

    4. Vega AI – 小众使用 Vega AI

    Vega AI虽小众,但提供强大的AI作图功能。

    5. 天空之盒 – 360旋转图 天空之盒

    天空之盒是一款能够生成360度旋转图的

    工具,为你的创作增添更多可能性。

    音频助手类

    1. Murf – 模拟真人声音 Murf

    Murf能够模拟真人声音,让你的音频内容更生动。

    2. Adobe podcast – 在线增强语音 Adobe podcast

    Adobe podcast是一款在线增强语音的工具,提升音频质量。

    3. Resemble AI – 声音复制 Resemble AI

    Resemble AI可以复制声音,创造出不同的音频效果。

    4. 网易天音 – 国产良心AI音乐创作 网易天音

    网易天音是国产AI音乐创作工具,为音乐人提供强大支持。

    5. Whisper – ai语音识别 Whisper

    Whisper是一款强大的ai语音识别工具,助力语音相关应用。

    GPT+应用类

    无论你是在创作、交流还是提升效率,这些AI工具都将成为你的得力助手。收藏这份清单,让AI助力你的工作和创意,创造出无限可能!

  • 预售中的吉兔坊2023新款中秋节手工桃山皮月饼礼盒,别具特色,向阳而生!

    大家好,中秋节即将来临,你是否正在寻找一份独特的礼物来祝福你的亲朋好友?如果是的话,那么吉兔坊的2023新款中秋节手工桃山皮月饼礼盒绝对是一个不错的选择!在本文中,我将为你介绍这款独特的月饼礼盒,带你了解它的特色和预售规则。不要错过这个机会,让我们一起来看看吧!

    吉兔坊2023新款中秋节手工桃山皮月饼礼盒

    为什么选择吉兔坊的月饼?

    吉兔坊是一家以手工制作月饼而闻名的品牌,他们注重每一道工序的细节,确保每一块月饼都是美味且精致的艺术品。他们的2023新款中秋节手工桃山皮月饼礼盒延续了这一传统,以其独特的设计和口感而备受欢迎。

    玉兔拼图:一份独特的礼物

    吉兔坊的这款月饼礼盒不仅仅是一份美味的礼物,更是一份独特的艺术品。礼盒上设计了一个玉兔拼图,寓意着团圆和幸福。当你打开礼盒时,你将会发现一块块精致的月饼,它们不仅美味,还展现出了吉兔坊的用心和创意。

    企业定制:定制你的祝福

    这款月饼礼盒还支持企业定制,你可以在礼盒上印上你公司的标志或特定的祝福语,这将是一份独特的中秋赠礼,展现出你对员工或合作伙伴的关心和感激之情。

    预售规则

    在购买吉兔坊的这款月饼礼盒之前,让我们来了解一下预售规则,以确保你能顺利获得这份美味的礼物。

    1. 预售商品定金下单后,请在30分钟内付款,以确保订单不被关闭。
    2. 预售商品可选择先支付定金,也可选择一次性支付全款,具体以商品详情页及下单页展示为准。
    3. 定金支付后,如果交易未完成且非京东或商家责任导致的,定金将不予退还。
    4. 尾款支付时,请在规定时间内支付,以免订单被关闭,定金不退还,赠品不予赠送。
    5. 预售商品的发货时间请以商品详情页中的描述为准。

    购买链接

    如果你已经被吉兔坊的这份美味和创意所吸引,不要犹豫,赶快点击下面的链接购买吧!中秋节即将到来,送上这份礼物,让你的亲朋好友感受到你的关爱和祝福。

    立即购买

    结语

    中秋节是一个团圆的日子,送上一份美味的月饼礼盒是表达关心和祝福的绝佳方式。吉兔坊的2023新款中秋节手工桃山皮月饼礼盒将为你的节日增添更多色彩和温馨。不要错过这个机会,赶快购买吧!

    如果你有任何疑问,欢迎联系客服咨询。祝大家中秋节快乐,阖家团圆!

  • 如何在stable diffusion Web UI中实现多GPU支持

    嗨,大家好!如果你有多个GPU在你的计算机上,并且想要充分利用它们来加速稳定扩散Web UI的图像生成,你来对地方了。在本文中,我将向你介绍如何实现多GPU支持,以便并行运行相同提示的推理任务。让我们开始吧!

    引言

    稳定扩散Web UI是一个用于生成图像的强大工具,但默认情况下,它可能只会使用一个GPU来进行图像生成。如果你有多个GPU,你可以通过并行化的方式来充分利用它们,从而提高生成速度。在本教程中,我们将探讨如何为稳定扩散Web UI实现多GPU支持。

    步骤 1:查看现有工作

    首先,我们来看一下社区中是否已经有人在实现多GPU支持方面有一些进展。从GitHub上的讨论中,我们可以看到一些用户已经开始探讨这个问题,并且有人提到了正在进行的工作。这对于了解目前的情况非常有帮助。

    步骤 2:熟悉stable diffusion Web UI的代码结构

    在开始实现多GPU支持之前,你需要熟悉稳定扩散Web UI的代码结构。这将有助于你找到适合并行化的部分以及在哪里将用户输入提供给模型。通常情况下,你需要查看processing.py文件中的代码,这是处理图像生成的地方。

    步骤 3:复制模型以支持多GPU

    一种实现多GPU支持的方法是复制stable diffusion模型,以便每个GPU都可以运行一个模型实例。然后,你可以将不同的输入提示提供给这些模型实例,并并行运行它们以生成图像。

    processing.py文件中,你可以查找与模型输入相关的部分,通常在process_images函数中。你需要修改这部分代码,以便能够同时运行多个模型实例,并将输出合并在一起。

    步骤 4:调整并行化参数

    要实现多GPU支持,你还需要调整一些并行化参数,以确保每个GPU都能够充分利用。这包括设置每个模型实例的输入提示,以及在合并生成的图像时要注意的事项。

    步骤 5:测试和优化

    完成上述步骤后,你应该进行测试以确保多GPU支持正常工作,并且图像生成速度有所提高。如果有必要,你还可以进行优化,以进一步提高性能。

    结论

    恭喜你,现在你已经知道如何在稳定扩散Web UI中实现多GPU支持!这将允许你更快地生成图像,充分利用计算资源。希望这个教程对你有所帮助。

    请注意,实现多GPU支持可能需要一些编程和技术知识,因此如果你不熟悉这方面的工作,可能需要花些时间来学习和实验。

    这就是如何在稳定扩散Web UI中实现多GPU支持的教程。如果你有任何问题或需要更多帮助,欢迎随时联系我们。祝你在图像生成领域取得成功!

  • 如何使用OpenAI的Web UI API进行文本到图像生成

    嗨,大家好!如果你对使用OpenAI的Web UI API进行文本到图像生成感到困惑,不用担心,我将为你提供一份详细的教程。在这个教程中,我将向你介绍如何设置API,构建请求,获取生成的图像以及如何修改一些重要的参数。让我们一起开始吧!

    引言

    首先,让我向你介绍OpenAI的Web UI API。这个API允许你使用文本描述来生成图像,这对于许多应用程序,如创意设计和内容生成,都非常有用。在本教程中,我将向你展示如何使用这个API,并通过一个例子来说明整个过程。

    步骤 1:启用API

    首先,你需要启用Web UI API。要做到这一点,你需要在运行Web UI时使用--api命令行参数。以下是在Windows上如何设置API的示例:

    在你的 "webui-user.bat" 文件中,添加以下行:

    set COMMANDLINE_ARGS=--api

    这个命令将启用API,然后你可以通过URL http://127.0.0.1:7860/docs 来查看API的文档和可用功能。

    步骤 2:构建请求

    现在,让我们来构建一个请求,告诉API我们想要生成什么样的图像。你可以使用一个包含参数的Python字典来构建请求。以下是一个示例:

    import requests
    
    url = "http://127.0.0.1:7860"  # 这个URL需要匹配你的Web UI的URL
    
    payload = {
        "prompt": "可爱的小狗",
        "steps": 5
    }

    在这个示例中,我们设置了两个参数:prompt是描述我们要生成的图像的文本,steps是生成的步数。你可以根据需要设置更多的参数,如果不设置,API将使用默认值。

    步骤 3:发送请求

    一旦你构建了请求,就可以将其发送给API。使用requests库来进行HTTP POST请求。以下是如何发送请求的示例:

    response = requests.post(url=f'{url}/sdapi/v1/txt2img', json=payload)

    在这个代码中,我们将请求发送到/sdapi/v1/txt2img端点,这个端点用于生成图像。确保URL与你的Web UI的URL匹配。

    步骤 4:获取生成的图像

    在API完成生成图像的任务后,它将响应返回到一个变量中,我们将其命名为response。响应中包含了三个条目:"images""parameters""info"。我们需要从中提取图像。

    首先,我们使用以下代码将响应解析为JSON格式,以便更容易地处理:

    r = response.json()

    然后,我们可以从"images"中获取生成的图像。这个图像实际上是一个包含随机字符的字符串,我们需要对其进行解码。以下是如何做到这一点的示例:

    from PIL import Image
    import io
    import base64
    
    for i in r['images']:
        image = Image.open(io.BytesIO(base64.b64decode(i.split(",", 1)[0])))

    现在,image变量中包含了生成的图像,你可以使用Pillow库(PIL)来进一步处理它,例如保存图像到文件。

    步骤 5:添加元数据到图像

    有时候,你可能想要将一些额外的元数据添加到生成的图像中。为了做到这一点,你可以使用/sdapi/v1/png-info端点。以下是如何将元数据添加到图像的示例:

    png_payload = {
        "image": "data:image/png;base64," + i
    }
    response2 = requests.post(url=f'{url}/sdapi/v1/png-info', json=png_payload)

    然后,你可以使用response2.json().get("info")来获取添加到图像的元数据。

    示例代码

    下面是一个完整的示例代码,演示了如何使用OpenAI的Web UI API进行文本到图像生成,以及如何添加元数据到图像:

    import requests
    import io
    import base64
    from PIL import Image
    
    url = "http://127.0.0.1:7860"
    
    payload = {
        "prompt": "可爱的小狗",
        "steps": 5
    }
    
    response = requests.post(url=f'{url}/sdapi/v1/txt2img', json=payload)
    
    r = response.json()
    
    for i in r['images']:
        image = Image.open(io.BytesIO(base64.b64decode(i.split(",", 1)[0])))
    
        png_payload = {
            "image": "data:image/png;base64," + i
        }
        response2 = requests.post(url=f'{url}/sdapi/v1/png-info', json=png_payload)
    
        # 添加元数据到图像
        image.save('output.png', pnginfo=PngImagePlugin.PngInfo.add_text("parameters", response2.json().get("info")))

    自定义设置和参数

    如果你想要修改一些设置和参数,你可以使用override_settings。这个参数允许你覆盖Web UI的设置,例如CLIP跳过的层数。以下是如何使用override_settings的示例:

    override_settings = {}
    override_settings["filter_nsfw"] = True
    override_settings["CLIP_stop_at_last_layers"] = 2
    
    override_payload = {
        "override_settings": override_settings
    }
    payload.update(override_payload)

    在这个示例中,我们将filter_nsfw设置为True,并将CLIP_stop_at_last_layers设置为2。然后,我们将这个override_settings添加到我们之前创建的payload中,以便在发送请求时应用这些设置。

    持久性设置

    有时候,你可能希望你的设置更加持久,而不仅仅是单个请求。你可以使用/sdapi/v1/options端点来实现这一点。以下是一个示例:

    option_payload = {
        "sd_model_checkpoint": "Anything-V3.0-pruned.ckpt [2700c435]",
        "CLIP_stop_at_last_layers": 2
    }
    
    response = requests.post(url=f'{url}/sdapi/v1/options', json=option_payload)

    在这个示例中,我们设置了模型检查点和CLIP跳过的层数,这些设置将持久保存,而不仅仅是单个请求。请注意,如果你要更改sd_model_checkpoint,则值应该与Web UI中显示的检查点名称相匹配。

    结论

    恭喜你!现在你已经学会了如何使用OpenAI的Web UI API进行文本到图像生成,以及如何自定义设置和参数。这个API为创意设计和内容生成提供了无限的可能性。希望这个教程对你有所帮助!

    关键词

    请注意:本教程中的示例和URL可能会根据最新信息发生变化,建议随时查阅OpenAI的官方文档以获取最新信息。

    这就是关于使用OpenAI的Web UI API进行文本到图像生成的详细教程。如果你有任何问题或需要进一步的帮助,欢迎随时联系我们。祝你在创意设计和内容生成方面取得成功!

  • 微软秋季发布会:Windows的AI时代从下周开始,Office也将在11月跟进

    嗨,亲爱的读者!科技的飞速发展一直都是我们关注的焦点,而微软(Microsoft)的最新秋季发布会可谓激动人心。在这次发布会上,微软不仅带来了令人期待的Surface硬件升级,更重要的是AI技术的引入,为我们带来了一场前沿科技的盛宴。

    从让每个家庭拥有电脑到赋能每个人和组织

    微软的CEO萨提亚·纳德拉在发布会开场时分享了一个动人的故事。当年他加入微软时,公司的愿景是让每个家庭、每张办公桌上都能拥有一台电脑。而如今,微软的愿景已经发展到了赋能地球上的每一个人和每一个组织,实现更大的成就。这个愿景的实现途径就是通过人工智能助手Copilot。

    Windows 11的AI升级:Copilot即将问世

    微软的Windows和Surface业务主管Yusuf Mehdi宣布了一项备受期待的消息:Windows 11操作系统的人工智能助手Copilot即将于9月26日开始以更新的方式推送。这将使Windows 11更加智能化,提供更多便捷的功能。除了系统级别的AI助手外,Windows 11的一些常用应用程序,如“照片”、“画图”、“记事本”、“邮件”等也将迎来AI时代。微软表示,这次更新将带来超过150个新功能,让你的计算体验更加智能化。

    Ink Anywhere:手写笔的AI应用

    微软还发布了一个名为“Ink Anywhere”的全新功能。除了可以用手写笔书写数学等式提问外,你还可以直接选中带图片的数学问题,然后交给Copilot进行解答。这一功能将在学习和工作中提供更多便利,让你更轻松地处理复杂的数学问题。

    Bing的AI升级:图片创作进化

    微软的搜索业务Bing也不甘示弱,在发布会上介绍了一项重要的升级。Bing的图片创作功能将在近期接入OpenAI最新发布的DALL-E 3,这将显著提升相同提示词下的成像质量。这意味着在搜索时,你将能够看到更加逼真和精美的图像,为你的学习和创作提供更多灵感。

    Office办公软件的AI功能即将上线

    对于Office办公软件的用户来说,也有令人兴奋的消息。Microsoft 365 Copilot将于今年11月1日开始面向商业用户开放。经过大半年的开发,这套体系在实现整个工作流程的“AI化”方面取得了巨大进步。365 Copilot可以调用整个办公环境下的文件,来回应提问并撰写文档。这将为企业用户提供更多智能化的工作工具,提高生产力。

    需要注意的是,除了仍需支付Microsoft 365的订阅费用外,企业用户要使用AI功能还需要每个员工每月额外支付30美元。

    Surface设备的升级:性能提升

    微软的Surface系列一直备受关注,而在发布会上,微软也展示了全新的Surface硬件。其中,最受瞩目的是Surface Laptop Studio 2。这款笔记本电脑搭载了英特尔i7 13700H/13800H处理器和英伟达4050/4060显卡,性能大幅提升,比上一代高出一倍。微软甚至通过演示展示了其在游戏性能上的卓越表现,让玩家们期待不已。

    价格方面,Surface Laptop Studio 2的起售价为1999.99美元,而全配版本需要3699.99美元。

    除此之外,微软还发布了新的入门款机型Surface Laptop Go 3,搭载英特尔i5-1235U处理器,起售价799.99美元。

    对于商业用户,微软也发布了Surface Go 4,这款10.5寸触屏设备搭载英特尔N200芯片,起售价579美元。另外,微软还更新了50寸大屏设备Surface Hub 3,这款设备主要面向会议室等需要互动的场合使用。

    微软的秋季发布会可谓一场精彩的科技盛宴,AI技术的引入使我们的计算体验变得更加智能和便捷。不仅如此,Surface

    系列的硬件升级也为用户带来了更多选择。让我们一起期待这些新技术和产品的到来,它们将极大地改善我们的生活和工作。

    以上就是微软秋季发布会的重要亮点,让我们一起期待这些创新技术的到来,它们将为我们的生活带来更多便利和乐趣。

    注意:以上报道中的日期和特定细节可能会根据最新信息发生变化,建议读者随时关注微软的官方消息以获取最新信息。

  • 微軟 Windows 11 更新版推出 Microsoft Copilot,革新 AI 助手

    你好,尊敬的读者!随着科技的飞速发展,我们迎来了一个全新的时代,AI(人工智能)的崭露头角正在深刻改变我们与科技互动的方式。在这个前沿科技的浪潮中,微软(Microsoft)于近日在美国纽约举行了一场盛大的发布会,正式宣布了一项重大突破——Microsoft Copilot。这个创新解决方案将彻底改变人们与科技互动的方式,提升生产力,将AI技术融入了Windows 11、Microsoft 365、Edge和Bing等产品中,实现了跨应用程序和设备的无缝AI体验。

    开创AI时代,Microsoft Copilot助你事半功倍

    微软全球资深副总裁暨消费者首席行销长Yusuf Mehdi表示:“我们正在进入全新的AI时代,从本质上改变了我们与科技互动和从中受益的方式。随着聊天界面和大型语言模型的融合,科技的智能已经发展到可以使用自然语言提出需求,进一步回答、创造,甚至采取回应行动。在微软,我们将这视为拥有一位副驾驶(Copilot)在旁,协助每一位工作者顺利完成各项任务。”

    这就是Microsoft Copilot的核心概念:一位AI助手,为你提供在各种工作和生活场景中的协助,使你事半功倍。无论是在Windows 11、Microsoft 365、Edge浏览器还是Bing搜索中,Copilot都将为你提供智能帮助。这一简单而无缝的体验将免费提供在Windows 11中,并可以作为应用程序使用,或者通过快捷键在需要时启动。Copilot将在9月26日Windows 11的下一版本中开始推出。

    Windows 11 更新:150项新功能助你更轻松完成任务

    Windows 11的最新版本将带来超过150项新功能,旨在让你更轻松地创建、更快速地完成任务,减轻日常工作负担,使复杂的任务变得简单。其中包括Copilot整合、新的Outlook for Windows、AI增强的Paint和Photos新功能、更新的Clipchamp、Notepad、现代化的文件管理器,以及Narrator中的新自然语音,使其更易于使用并增强生产力。微软将以Windows为平台,为用户提供最佳的AI体验,这些更新将从9月26日开始,随着Windows 11的最新版本22H2一同推出。

    Bing和Edge的全新功能:个性化答案、AI生成图像和更多

    Bing和Edge也不甘示弱,它们带来了一系列令人兴奋的新功能。这些包括根据聊天历史生成的个性化答案、Bing Image Creator中改进的OpenAI DALL.E 3模型,以及新的内容凭证,使用加密方法为Bing中所有AI生成的图像添加一个隐形的数字水印,包括图像的创建时间和日期。Bing Chat可以在Microsoft Edge中或bing.com/chat上使用,并将很快推出更多相关功能。

    Microsoft Shopping中的Copilot:AI助你更智能购物

    Bing和Edge现在可以根据你的需求提供更个性化的建议和最佳价格,并由AI提供支持。之后,还可以使用照片或已储存的图像来展开全新的购物体验,这将使购物变得更加智能和便捷。

    Bing Chat企业版更新:免费为Microsoft 365用户提供多模式视觉搜索

    对于超过1.6亿的Microsoft 365用户来说,好消息是你不需要额外付费,已经可以开始免费使用Bing Chat企业版,同时也可以在移动设备上的Microsoft Edge应用程序中使用。Bing Chat企业版加入了多模式视觉搜索和影像创建工具的支持,以提升工作中的创造力。

    Microsoft 365 Copilot企业版:全新AI助手将改变工作方式

    从2023年11月1日起,Microsoft 365 Copilot企业版将向企业客户全面推出,同时还将推出Microsoft 365 Chat,这是一个全新的AI助手,将彻底改变工作方式。这将为企业提供更多创新和高效的工作工具,提高生产力。

    Microsoft 365 Copilot消费版:AI助你打造独特的视觉效果

    Microsoft 365 Copilot消费版中的Designer将整合到Microsoft 365 Copilot个人用户版中,首先将应用于Word中。Designer可以帮助您将繁琐的文档转化为定制的图像,使用AI创建出令人惊艳的视觉效果、社交媒体帖子或邀请函等。

    全新Surface设备:融合AI功能的创新力

    微软不仅提供了创新的软件,还推出了一系列全新的Surface设备,它们结合了强大的AI功能。其中包括:

    • 全新Surface Laptop Studio 2:这是迄今为止最强大的Surface,搭载了最新的Intel

      Core处理器和专为创作者设计的先进NVIDIA Studio工具。Surface Laptop Studio集创作的多功能性和强大的性能于一身,拥有令人惊艳的14.4英寸PixelSense Flow触摸屏和三种独特的展示模式。

    • 全新Surface Laptop Go 3:这是最轻巧、最便携的Surface笔记本电脑,配备了触摸屏,具有出色的打字体验和指纹电源按钮,还提供了四种时尚的颜色选择。它搭载Intel Core i5处理器,具有全天候的电池续航能力,以及丰富的RAM和存储空间选项,是完美的日常笔记本电脑,也可以与微软最新的AI工具结合使用。

    • Surface Go 4商用版:这是最便携的Surface二合一设备,专为企业客户提供。新的Surface Go将只向企业客户提供,延续其为前线工作和教育等场景所建立的动能。

    • Surface Hub 3:这是微软为混合工作模式而设计的顶级协作设备,可以无缝地与所有Teams认证的设备配合使用,整合AI协作工具带来全新的协作体验。Microsoft Teams Rooms可以在一个智能的50英寸或85英寸屏幕上运行,带来更强大的协作能力。

    • 可3D打印的Surface Pen适应性笔夹:这个创新的笔夹允许你下载3D打印的设计图,让更多人能够使用数字笔迹和创作功能。

    微软强调,它汇聚了强大而实用的AI体验,并将这些体验以简单、安全且负责任的方式融入了人们最常使用的产品中。Windows 11旨在提供最佳的AI体验,为人们的工作、学习和家庭生活提供更多动能;Microsoft 365是全球最受信任的生产力工具;Bing和Edge则代表了最创新的搜索引擎和浏览器。所有这些功能都可以在Windows 11电脑上完美结合,而Copilot将为每个人提供高效的协助,让工作和生活更加轻松。

    不要错过这个科技革新的机会,尽早体验Microsoft Copilot和Windows 11的全新功能,让AI助手帮助你事半功倍!

    以上是微软最新发布的重大消息,我们将持续关注并为您带来更多科技前沿的报道。


    注意:以上报道中的日期和特定细节可能会根据最新信息发生变化,建议读者随时关注微软的官方消息以获取最新信息。

  • 用 CompreFace 轻松实现人脸识别:无需机器学习技能

    你是否曾想过在你的应用或系统中添加人脸识别功能,但又担心需要复杂的机器学习技能?不用担心,Exadel CompreFace 是一款领先的免费开源人脸识别系统,可以轻松集成到任何系统中,无需先修的机器学习技能。

    开篇故事:解锁新时代的人脸识别

    在数字时代,人脸识别技术已经成为了许多领域的重要组成部分,从手机解锁到身份验证,无处不在。但是,要在你自己的应用或系统中实现人脸识别,通常需要深奥的机器学习知识和大量的工程工作。这对于大多数人来说都是一项巨大的挑战。

    然而,现在有了一个令人兴奋的解决方案 – Exadel CompreFace。它是一个免费且开源的人脸识别系统,无需复杂的机器学习技能,即可轻松集成到你的应用或系统中。无论你是一名开发人员、企业家还是普通用户,都可以受益于这个强大的工具,为你的项目增添人脸识别功能。

    Exadel CompreFace 简介

    Exadel CompreFace 是一款基于 Docker 的应用,可以作为独立服务器或部署在云上。不需要机器学习专业知识,你就可以轻松设置和使用 CompreFace。该系统提供了人脸识别、人脸验证、人脸检测、特征点检测、口罩检测、头部姿势检测、年龄和性别识别等功能的 REST API,并可通过 Docker 轻松部署。

    主要特点

    Exadel CompreFace 提供了许多强大的特点和功能,使其成为一个出色的人脸识别解决方案:

    • 支持 CPU 和 GPU,易于扩展。
    • 开源且可自托管,为数据安全提供额外的保障。
    • 可以部署在云上或本地服务器上。
    • 无需机器学习专业知识即可设置和使用。
    • 使用 FaceNet 和 InsightFace 等先进的人脸识别方法。
    • 仅需一个 Docker 命令即可快速启动。

    如何开始使用 CompreFace

    要开始使用 Exadel CompreFace,你需要满足以下要求:

    1. 安装 Docker 和 Docker Compose(或 Docker Desktop)。
    2. 你的计算机应具备 x86 处理器AVX 支持
      在 Linux 上检查 AVX 支持,运行 lscpu | grep avx 命令。

    在 Linux 和 MacOS 上开始:

    1. 安装 Docker 和 Docker Compose。
    2. 从最新的发布版本下载存档:https://github.com/exadel-inc/CompreFace/releases
    3. 解压存档。
    4. 在该文件夹中打开终端,并运行以下命令:docker-compose up -d
    5. 在浏览器中打开服务:http://localhost:8000/login

    在 Windows 上开始:

    1. 安装 Docker Desktop。
    2. 从最新的发布版本下载存档:https://github.com/exadel-inc/CompreFace/releases
    3. 解压存档。
    4. 运行 Docker。
    5. 打开命令提示符(在 Windows 搜索栏中输入 cmd)。
    6. 打开你解压缩的存档文件夹(使用 cd 文件夹路径 命令,然后按 Enter)。
    7. 运行命令:docker-compose up -d
    8. 打开 http://localhost:8000/login

    CompreFace SDK

    CompreFace 还提供了多种语言的 SDK,以便于与你的应用集成。以下是一些可用的 SDK:

    详细文档和支持

    CompreFace 提供了详细的文档,包括如何使用、REST API 描述、配置和架构等内容。你可以在官方文档中找到所有需要的信息:文档链接

    贡献和支持

    如果你对 Exadel CompreFace 感兴趣并希望为项目做出贡献,有许多方式可以参与:

    • 使用 CompreFace 并在 GitHub 上报告问题或提出建议。
    • 通过发布指南和文章分享知识和经验,或改进文档
    • 为你喜欢的编程语言创建SDK,我们将把它添加到我们的文档中。
    • 将 CompreFace 支持集成到其他平台,如 Home AssistantDreamFactory,我们将添加到我们的文档中。
    • 贡献代码。
    • 为人脸服务添加插件
    • 最后但同样重要的是,在 GitHub 上为我们的免费人脸识别系统点赞。

    结尾

    Exadel CompreFace 是一款强大且易于使用的开源人脸识别系统,可以轻松集成到你的应用或系统中,无需机器学习技能。不再让人脸识别技术成为门槛,让你的项目进入新时代!

    现在,你可以探索 CompreFace,并为你的项目添加强大的人脸识别功能,无需繁琐的机器学习知识。试试看吧!

    注意:文章中的所有信息基于作者阅读的资料并按照作者的指导创建。某些细节可能已经发生变化,因此建议在使用 CompreFace 或参与项目时查阅最新的官方文档和资源。

  • 创造高清幻想面孔:探索 PULSE 自监督图像放大

    有一天,你突然翻出了你小时候的一本相册,上面有你和家人的照片。然而,你却发现这些照片的质量非常低,因为它们是在过去的老相机上拍摄的。你决定将这些珍贵的瞬间变得更加清晰和生动。幸运的是,有一种神奇的技术可以帮助你实现这一目标,那就是PULSE。

    PULSE是一个自监督图像放大工具,它可以将低分辨率的图像转化为高分辨率的图像,使它们看起来更加真实和清晰。不过需要注意的是,PULSE不会帮助你识别或重建原始图像中的人物,因为它生成的是虚构的面孔,而不是真实存在的人物。

    简介

    PULSE的工作原理相当令人惊叹。它利用生成模型(例如StyleGAN)的输出来搜索高分辨率图像,这些图像在视觉上看起来逼真,并且以正确的方式降低分辨率,从而保持图像质量。这意味着你可以将你那些模糊的旧照片变得更加清晰和生动,仿佛时光倒流,让你重新体验那些美好的时刻。

    如何使用PULSE

    如果你想使用PULSE,以下是一些开始的步骤:

    先决条件

    首先,你需要安装CMake(这是必需的,因为PULSE使用了用于人脸对齐的dlib库)。此外,PULSE目前仅支持安装了CUDA的系统(因此需要适当的GPU),并且已经在Linux和Windows上进行了测试。为了安装所需的Python包,你可以使用提供的Conda环境YAML文件,例如:

    conda create -f pulse.yml 

    或者(在Windows上使用Anaconda):

    conda env create -n pulse -f pulse.yml
    conda activate pulse

    在某些环境中(例如在Windows上),你可能需要编辑pulse.yml文件,删除每个依赖项的特定版本哈希值,并删除仍然在运行conda env create后引发错误的任何依赖项(例如readline)。

    最后,首次运行代码时,你需要与互联网连接,因为它将自动从Google Drive下载相关的预训练模型(如果已经下载,它将使用本地副本)。如果公共的Google Drive容量不足,你可以将文件添加到你自己的Google Drive中,然后获取共享链接,将链接中的ID替换为你自己Drive文件的共享链接中提供的新文件ID,将其替换为align_face.pyPULSE.py中的链接。

    数据准备

    默认情况下,run.py的输入数据应该放在./input/目录下(虽然这可以通过修改来更改)。然而,这假定人脸已经被对齐和降分辨率。如果你的数据不是这种格式,可以将它们放在realpics目录下,并运行align_face.py,它将自动为你执行对齐和降分辨率操作(同样,如果更方便,所有目录都可以通过命令行参数进行更改)。在此阶段,你需要选择一个降分辨率的因子。

    需要注意的是,如果你的数据已经具有较低的分辨率,进一步降分辨率将保留非常少的信息。在这种情况下,你可以选择使用双三次插值将图像放大到较高分辨率(通常是1024×1024),然后允许align_face.py为你执行降分辨率操作。

    应用PULSE

    一旦你的数据已经格式化,你只需要运行以下命令:

    python run.py

    尽情享受吧!

    通过PULSE,你可以轻松将低分辨率图像转化为高分辨率图像,让你的珍贵回忆变得更加清晰和生动,仿佛重新回到那个美好的时刻。

    这就是PULSE的神奇之处,它为你提供了一个强大的工具,让你能够重新发现并分享那些珍贵的瞬间。

    不过需要谨记,尊重隐私和伦理原则,不要滥用这项技术。

    希望你能享受使用PULSE,为你的照片带来全新的生命!

  • Retrieval-based-Voice-Conversion-WebUI使用指南

    曾经有一位年轻的音乐爱好者,他对声音的变化充满了浓厚兴趣。然而,他一直感到无奈,因为要实现声音的转换似乎需要高昂的成本和专业的设备。但是有一天,他发现了一个神奇的工具,一个名为"Retrieval-based-Voice-Conversion-WebUI"的项目。这个项目让他能够以前所未有的简单方式改变声音,他的音乐世界因此而翻开了新的一页。

    掌握声音的魔法

    音乐、娱乐和创作中声音的变化一直是一个令人着迷的领域。无论是将一首歌曲的声音转化为不同的风格,还是将自己的声音变成卡通角色,声音转换技术都有着广泛的应用。但是在过去,要实现声音的转换通常需要专业的音频工程师和昂贵的设备。

    然而,随着技术的进步,现在有了一种全新的声音转换框架,名为"Retrieval-based-Voice-Conversion-WebUI",它是基于VITS(Variational Inference Text-to-Speech)的,提供了一个简单易用的界面,让任何人都能够轻松实现声音的转换。

    什么是"Retrieval-based-Voice-Conversion-WebUI"?

    "Retrieval-based-Voice-Conversion-WebUI"是一个开源项目,旨在提供一个基于VITS的声音转换框架,它具有以下特点:

    1. 减少音色泄漏

    通过使用前1名检索(Top1 retrieval)来替换源特征为训练集特征,"Retrieval-based-Voice-Conversion-WebUI"能够显著减少音色泄漏,确保声音转换的质量。

    2. 简单快速的训练

    即使在相对较弱的图形卡上,"Retrieval-based-Voice-Conversion-WebUI"也能够进行简单快速的训练。这意味着你不需要昂贵的硬件来开始声音转换项目。

    3. 少量数据也能获得良好结果

    "Retrieval-based-Voice-Conversion-WebUI"支持使用少量数据进行训练,即使只有10分钟的低噪音语音,也能够获得相对好的结果。

    4. 模型融合以改变音色

    如果你想改变音色,"Retrieval-based-Voice-Conversion-WebUI"支持模型融合,让你能够实现更多样化的声音效果。

    5. 易于使用的Web界面

    "Retrieval-based-Voice-Conversion-WebUI"提供了一个易于使用的Web界面,让你能够轻松进行声音转换,无需复杂的命令行操作。

    6. 强大的高音声音提取算法

    "Retrieval-based-Voice-Conversion-WebUI"使用了一种最强大的高音声音提取算法,确保声音转换时不会出现静音问题。这个算法比传统的方法更快速,资源消耗更低,效果更好。

    7. 跨硬件支持

    "Retrieval-based-Voice-Conversion-WebUI"支持Nvidia、AMD、Intel等不同品牌的图形卡,让你可以选择最适合你的硬件来进行声音转换。

    准备环境

    在使用"Retrieval-based-Voice-Conversion-WebUI"之前,你需要准备好以下环境:

    安装主要依赖项

    首先,你需要安装Python 3.8或更高版本,并通过pip安装以下主要依赖项:

    # 安装PyTorch相关核心依赖项,如果已安装则跳过
    pip install torch torchvision torchaudio

    如果你使用的是Windows,并且有Nvidia的Ampere架构(RTX30xx)的显卡,你需要根据这个链接的经验,指定与PyTorch相对应的cuda版本进行安装。

    如果你使用的是Linux,并且有AMD显卡,你需要使用以下命令来安装适用于ROCm 5.4.2的PyTorch版本:

    pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2

    使用Poetry安装其他依赖项

    你可以使用Poetry来安装"Retrieval-based-Voice-Conversion-WebUI"的其他依赖项:

    # 安装Poetry依赖管理工具,如果已安装则跳过
    curl -sSL https://install.python-poetry.org | python3 -
    
    # 安装项目依赖项
    poetry install

    如果你不使用Poetry,也可以使用pip来安装它们:

    # 对于Nvidia显卡用户
    pip install -r requirements.txt
    
    # 对于Windows上的AMD/Intel显卡用户(使用DirectML):
    pip install -r requirements-dml.txt
    
    # 对于Linux / WSL上使用Python 3.10的Intel ARC显卡用户:
    pip install -r requirements-ipex.txt
    
    # 对于Linux上的AMD显卡用户(使用ROCm):
    pip install -r requirements-amd.txt

    准备

    其他预训练模型

    "Retrieval-based-Voice-Conversion-WebUI"需要其他预训练模型来进行推断和训练。你需要从他们的Huggingface空间下载这些模型。

    以下是"Retrieval-based-Voice-Conversion-WebUI"所需的预训练模型和其他文件的列表:

    • ./assets/hubert/hubert_base.pt
    • ./assets/pretrained
    • ./assets/uvr5_weights

    如果你想测试模型的v2版本,还需要下载以下文件:

    • ./assets/pretrained_v2
    • ./assets/pretrained_v2

    如果你使用Windows,可能还需要下载以下两个文件,如果已经安装了FFmpeg和FFprobe,则可以跳过:

    • ffmpeg.exe
    • ffprobe.exe

    最后,如果你想使用最新的SOTA RMVPE(Real-time Multif0 Voice Pitch Estimation)声音提取算法,你需要下载RMVPE权重文件,并将其放在"Retrieval-based-Voice-Conversion-WebUI"的根目录中。

    • rmvpe.pt

    对于AMD/Intel显卡用户,还需要下载以下文件:

    • rmvpe.onnx

    如何使用"Retrieval-based-Voice-Conversion-WebUI"

    一旦你准备好了环境和预训练模型,你就可以开始使用"Retrieval-based-Voice-Conversion-WebUI"了。如果你使用的是Windows或macOS,你可以下载并解压"RVC-beta.7z",然后使用"go-web.bat"(Windows)或"sh ./run.sh"(macOS)来启动Web界面。

    如果你使用的是Linux,可以使用以下命令启动Web界面:

    python infer-web.py

    如果你使用的是Intel ARC显卡,需要在启动Web界面之前运行source /opt/intel/oneapi/setvars.sh命令。

    如果你使用的是Linux,并且有AMD显卡(使用ROCm),可以按照这里的说明安装所有必需的驱动程序。然后运行上述命令启动Web界面。

    结语

    "Retrieval-based-Voice-Conversion-WebUI"是一个令人惊叹的工具,它为声音转换提供了前所未有的简便性和效果。无论你是音乐制作人、娱乐爱好者还是创作者,都可以借助这个框架来实现声音的变换和创造。不再需要昂贵的设备和复杂的操作,现在你可以轻松地探索声音的奇妙世界。

    如果你对声音转换技术感兴趣,不妨尝试一下"Retrieval-based-Voice-Conversion-WebUI",你会被它的功能和便利性所折服的。

  • 为什么Go不会重构成Java:性能、生态和生产环境考虑

    你是否曾想象过,随着JDK 21的更新,Go语言是否有可能在未来会重构成Java?虽然这种想法听起来有点奇怪,但让我们探讨一下这个问题,看看Java的最新特性和Go语言之间的性能差异是否可能改变这一情况。

    开篇故事

    故事发生在一个充满技术讨论的社区中,一位老Java程序员提出了一个大胆的问题:随着JDK 21的更新,会不会引发Go系统重构成Java的KPI需求?这个问题引发了一场激烈的讨论,让我们一起来看看这些程序员们的观点和看法。

    JDK 21的更新

    首先,让我们了解一下JDK 21的更新。根据讨论中提到的信息,JDK 21带来了一些重要的变化,其中一个显著的特性是Java虚拟线程(Java Virtual Thread)。这一特性被认为是对JDK库进行了彻底的重构,为Java带来了更好的并发性能和开发者友好性。

    Java Virtual Thread与Goroutine性能比较

    有人提出了一个有趣的问题:Java Virtual Thread与Go语言的Goroutine在性能上有什么区别?Goroutine是Go语言中的轻量级线程,它们非常适合并发编程。

    Java和Go的差异

    然后,一些程序员开始讨论Java和Go之间的根本差异。他们指出,Java和Go不仅在并发模型上存在差异,还在语法、学习曲线、依赖管理、工程化、实施部署、向后兼容性、生态、云原生支持等各个方面都有明显的不同。

    Go的生态和云原生

    一位程序员提到,Go语言的生态和云原生支持使其在云原生领域非常受欢迎。虽然Java在某些领域仍然非常强大,但在云原生环境中,Go语言已经占据了重要地位。

    Java的内存占用和轻量级选项

    另一位程序员提到了Java的内存占用问题。他认为,由于Java的内存占用相对较高,很少有人愿意抛弃Go的轻量级选项来迁移到Java。

    结论

    综上所述,从讨论中可以得出结论,Go语言不太可能重构成Java的KPI需求。虽然JDK 21带来了一些有趣的新特性,但Java和Go之间的差异太大,不仅仅是在并发模型上,还包括生态、云原生支持等方面。而且,Go语言在云原生领域有着强大的地位,Java在这方面处于次要角色。

    虽然Java仍然在许多领域中表现出色,但Go语言已经在特定领域中占据了主导地位。因此,从现实角度来看,Go语言不太可能重构成Java的KPI需求,至少在可预见的未来是这样的。

    在技术领域,事情总是在不断变化,但当前的趋势和差异表明,Go语言和Java将继续各自发展,而不是互相重构。

    结语

    尽管我们在这里讨论了这个问题,但实际上,语言选择通常受到多种因素的影响,包括性能、生态系统、生产环境和开发者的偏好。因此,无论是Java还是Go,都有其自身的优势和用途,最终选择取决于具体的项目需求和情况。

    希望这篇文章能够帮助你更好地理解Java和Go之间的差异,并为你的项目选择提供一些有用的思考。

    注意:本文中的观点和讨论仅代表参与讨论的程序员个人观点,并不代表一种普遍的观点。