Attempt to use <title> from HTML as a fallback
authorMark Felder <feld@FreeBSD.org>
Wed, 12 Jun 2019 22:56:51 +0000 (17:56 -0500)
committerMark Felder <feld@FreeBSD.org>
Wed, 12 Jun 2019 22:56:51 +0000 (17:56 -0500)
lib/pleroma/web/rich_media/parsers/meta_tags_parser.ex

index 4a7c5eae0720f4e492a56e1e4fe5088cfbfacae3..7da4e7561ca54bdc8b54da1bf7f4eecdd93cffa1 100644 (file)
@@ -1,12 +1,14 @@
 defmodule Pleroma.Web.RichMedia.Parsers.MetaTagsParser do
   def parse(html, data, prefix, error_message, key_name, value_name \\ "content") do
     with elements = [_ | _] <- get_elements(html, key_name, prefix),
+         page_title = get_page_title(html),
          meta_data =
            Enum.reduce(elements, data, fn el, acc ->
              attributes = normalize_attributes(el, prefix, key_name, value_name)
 
              Map.merge(acc, attributes)
-           end) do
+           end)
+           |> Map.put_new(:title, page_title) do
       {:ok, meta_data}
     else
       _e -> {:error, error_message}
@@ -27,4 +29,8 @@ defmodule Pleroma.Web.RichMedia.Parsers.MetaTagsParser do
 
     %{String.to_atom(data[key_name]) => data[value_name]}
   end
+
+  defp get_page_title(html) do
+    Floki.find(html, "title") |> Floki.text()
+  end
 end